logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

[554]sklearn提供的自带的数据集(make_blobs)

sklearn 的数据集有好多个种自带的小数据集(packaged dataset):sklearn.datasets.load_可在线下载的数据集(Downloaded Dataset):sklearn.datasets.fetch_计算机生成的数据集(Generated Dataset):sklearn.datasets.make_svmlight/libsvm格式的数据集:skle...

[1302]FunAudioLLM – 阿里通义团队推出的开源语音大模型

模型结构如下图所示:经过超过40万小时的数据训练,支持50多种语言,其识别性能超越了Whisper模型。具备出色的情感识别能力,在测试数据上超越了当前最佳模型。提供声音事件检测能力,支持检测各种常见的人机交互事件,如背景音乐、掌声、笑声、哭泣、咳嗽和打喷嚏。SenseVoice-Small模型采用非自回归的端到端框架,具有极低的推理延迟。处理10秒音频仅需70毫秒,比Whisper-Large快1

#开源
[465]深度学习识别滑动验证码缺口

本节主要介绍了训练深度学习模型来识别滑动验证码缺口的整体流程,最终我们成功实现了模型训练过程,并得到了一个深度学习模型文件。利用这个模型,我们可以输入一张滑动验证码,模型便会预测出其中的缺口的位置,包括偏移量、宽度等,最后可以通过缺口的信息绘制出对应的位置。

#深度学习#人工智能
[350]Scikit-learn实例之Pca+Svm人脸识别(AT&T数据集)

理论基础   本算法流程就是用主成分分析(Pca)对人脸数据集进行降维,得到数个人脸特征向量。对于任意一个人脸样本,将样本数据向特征向量投影,得到的投影系数作为人脸的特征表示。使用支持向量机(SVM)对这些不同的投影系数向量分类,来进行人脸识别。  (1)人脸识别经典算法:

[1302]FunAudioLLM – 阿里通义团队推出的开源语音大模型

模型结构如下图所示:经过超过40万小时的数据训练,支持50多种语言,其识别性能超越了Whisper模型。具备出色的情感识别能力,在测试数据上超越了当前最佳模型。提供声音事件检测能力,支持检测各种常见的人机交互事件,如背景音乐、掌声、笑声、哭泣、咳嗽和打喷嚏。SenseVoice-Small模型采用非自回归的端到端框架,具有极低的推理延迟。处理10秒音频仅需70毫秒,比Whisper-Large快1

#开源
[1106]python bezier(贝塞尔)曲线

文章目录三阶贝塞尔曲线python bezier曲线首先简单了解一下什么是贝塞尔曲线(余弦函数曲线我就不多说了哈!),贝塞尔曲线又称贝兹曲线,是法国工程师皮埃尔.贝塞尔于1962年发表。贝塞尔曲线广泛应用于二维绘图软件,早期用于汽车车体设计。三阶贝塞尔曲线三阶贝塞尔曲线由如下方程描述:其中t的范围是0到1的闭区间。P0和P3是三阶贝塞尔曲线的起点和终点,P1和P2是曲线的控制点。然后我们讲一下计算

#python
[548]OpenCV之cv2函数

1、主要函数1、 cv2.imread():读入图片,共两个参数,第一个参数为要读入的图片文件名,第二个参数为如何读取图片,包括cv2.IMREAD_COLOR:读入一副彩色图片;cv2.IMREAD_GRAYSCALE:以灰度模式读入图片;cv2.IMREAD_UNCHANGED:读入一幅图片,并包括其alpha通道。PS:调用opencv,就算图像的路径是错的,OpenCV 也不会提...

[1305]whisper(音转文)使用教程

它是一个快速推理引擎,用于 Transformer 模型,相比 OpenAI 的 Whisper 模型,速度提升了 4 倍。根据我的实测结果,这个模型的表现非常优秀,它可以识别多种语言,包括中文,而且中文识别效果非常出色。faster-whisper参考:https://blog.csdn.net/gitblog_00489/article/details/141049036。whisper-we

[1306]whisper报错:UserWarning: FP16 is not supported on CPU; using FP32 instead

参考:https://blog.csdn.net/shanchuan2012/article/details/131774957。WHISPER使用的时候出现的问题,因为并不想动之前的pytorch环境,解决办法在参数中加入。这个报错说的是whisper要使用cpu,而你音频是fp16的,cpu不支持。应该是搞别的时候把torch给搞成cpu版本的了。要点在于如何解决为什么whisper没使用GP

[284]Python使用execjs执行js

总注:使用execjs的难点并不是在execjs这个库, 而是解析JS的过程, 因为没有浏览器的环境, 没有加密源码的依赖。从成千上万行的JS中择出想要的内容,可能是一段孤零零的JS函数,也可能是从几个JS文件去找出各自找出一段JS代码, 并可以通过execjs顺利执行, 这并非易事。需要注意的是: 个别的JS语句, 用execjs返回的结果跟浏览器环境返回的结果是有区别的, 以下是浏览器环境返回

#python#javascript
    共 167 条
  • 1
  • 2
  • 3
  • 17
  • 请选择
OSZAR »