logo
publist
写文章

简介

微信公众号:@蚝油菜花 如果你也关注大模型发展现状,或对大模型应用开发非常感兴趣,很期待你的关注,我会每日分享最新的热点资讯和开源模型实例。

擅长的技术栈

AI 应用开发人工智能深度学习PyTorch

可提供的服务

分享大模型与AI领域的最新应用和热点信息,提供开源实例和实用教程,帮助快速上手AI技术。

AutoGLM:智谱 AI 推出模拟人类操作手机的 AI 产品,内附官方演示和申请通道!

AutoGLM 是一种基于图形用户界面(GUI)的自主任务完成智能体,能够模拟人类操作手机,执行社交媒体互动、在线购物、酒店预订等任务。

文章图片
#人工智能#计算机视觉#语言模型
ACE++:输入想法就能完成图像创作和编辑!阿里通义推出新版自然语言驱动的图像生成与编辑工具

ACE++ 是阿里巴巴通义实验室推出的升级版图像生成与编辑工具,支持多种任务,如高质量人物肖像生成、主题一致性保持和局部图像编辑。

文章图片
#人工智能#开源
PyVideoTrans:视频多语言自动翻译与配音,影视后期新利器

PyVideoTrans 是一款开源的视频翻译和配音工具,支持多语言,集成了语音识别、自动翻译和高质量语音合成技术,适用于影视后期、教育、企业宣传和自媒体内容创作等多种场景。

文章图片
#音视频#机器翻译#人工智能
复古胶片风!Filmfotos 胶片模拟技术,带你穿越时光的影像魔法

Filmfotos 是基于 Flux 架构的 LoRA 模型,专精于模拟和还原胶片质感效果,以低饱和度的日系胶片风格为特点,适用于多种场景,带来柔和、细腻的复古美感。通过深度学习和图像处理算法,实现了高精度的图像生成。

文章图片
#开源#计算机视觉#图像处理
MimicTalk:字节跳动和浙江大学联合推出 15 分钟生成 3D 说话人脸视频的生成模型

MimicTalk 是由字节跳动和浙江大学联合开发的一种基于 NeRF 技术的 3D 说话人脸视频生成模型。该模型能够在 15 分钟内生成个性化且富有表现力的 3D 说话人脸视频,显著提高了训练效率和视频质量。本文将详细介绍 MimicTalk 的主要功能、技术原理以及如何运行该模型。

文章图片
#人工智能#开源#计算机视觉 +1
Chonkie:轻量高效的 RAG 分块库,支持 Token、单词、句子和语义相似性等多种分块方法

Chonkie 是一个轻量级、快速且功能丰富的 RAG 分块库,支持多种分块方法,适用于各种自然语言处理任务。

文章图片
#自然语言处理#人工智能#开源 +1
Fin-R1:上海财大开源金融推理大模型!7B参数竟懂华尔街潜规则,评测仅差满血版DeepSeek3分

Fin-R1是上海财经大学联合财跃星辰推出的金融领域推理大模型,基于7B参数的Qwen2.5架构,在金融推理任务中表现出色,支持中英双语,可应用于风控、投资、量化交易等多个金融场景。

文章图片
#开源#金融
Qlib:华尔街颤抖!微软开源金融AI量化投资神器,助力智能投研

Qlib是微软亚洲研究院推出的开源AI量化投资平台,提供从数据处理、模型训练到组合管理的全流程支持,内置高性能数据基础设施和多种机器学习模型。

文章图片
#开源#人工智能
Baichuan-M1-14B:AI 助力医疗推理,为患者提供专业的建议!百川智能开源业内首个医疗增强大模型,普及医学的新渠道!

Baichuan-M1-14B 是百川智能推出的首个开源医疗增强大模型,专为医疗场景优化,支持多语言、快速推理,具备强大的医疗推理能力和通用能力。

文章图片
#人工智能
VITRON:开源像素级视觉大模型,同时满足图像与视频理解、生成、分割和编辑等视觉任务

VITRON 是由 Skywork AI、新加坡国立大学和南洋理工大学联合推出的像素级视觉大模型,支持图像与视频的理解、生成、分割和编辑,适用于多种视觉任务。

文章图片
#音视频#人工智能#开源
    共 229 条
  • 1
  • 2
  • 3
  • 23
  • 请选择
OSZAR »