logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

大模型RAG实战|向量数据库:Elasticsearch实现混合检索(附完整代码)

大模型RAG实战系列文章,带你深入探索使用LlamaIndex框架,构建本地大模型知识库问答系统。本系列涵盖知识库管理、检索优化、模型本地部署等主题,通过代码与实例,讲解如何打造生产级系统,实现本地知识库的快速检索与智能问答。当时,我们采用的向量数据库是,作为LlamaIndex中的向量存储(Vector Store)。Chroma是一个非常简单易用的嵌入式向量数据库,在开发和测试场景非常受欢迎。

文章图片
#数据库#elasticsearch#大数据 +3
大模型开发者必备:探索市场上常见的 LLM 部署平台

随着大模型技术的蓬勃发展,在线运行测试大语言模型(LLM)的平台如雨后春笋般不断出现。这些平台为开发者、研究人员和爱好者提供了一个宝贵的资源,可以在无需复杂设置或大量投资的情况下,对不同模型进行实验。这篇文章我们会对比这些 LLM 部署平台,看看它们在功能、性能和可访问性方面的表现,帮助您决定哪个平台最适合您的需求。

文章图片
#人工智能#搜索引擎#百度 +2
向量数据库在AI大模型各环节技术原理深度分析 2024

在模型推理过程中,向量数据库也可解决AI大模型知识的时效低、输入能力有限以及准确度低的问题。接下来,我们就向量数据库在AI大模型各环节赋能的技术原理和实际应用案例进行深入分析。图 6:AI大模型MLOps过程中向量数据库的功能(二)向量数据库既能提升 AI 大模型各环节效率,又能保障用户数据安全向量数据库在AI大模型训练和推理过程中有较大的应用空间。向量数据库是专门用于存储和管理向量数据,其主要特

文章图片
#数据库#人工智能#开源 +2
工业大模型: 体系架构、关键技术与典型应用

工业大模型是面向工业产品全生命周期应用的、具有大规模参数的深度学习模型体系,包括工业基座大模型、工业任务导向大模型、工业行业领域大模型等不同层次和类别的模型系统。

文章图片
#架构#信息可视化#人工智能 +3
ACL 24|SAC-KG:利用大模型自动构造领域知识图谱

知识图谱(Knowledge Graph, KG)已经被应用于医学、生物学和社交网络等多个领域。然而,构建特定领域 KG 需要大量专业知识和人工干预,这严重限制了其实际构建。例如,在医学领域构建知识图谱,需要医学专家对大量医学文献、病例等进行分析和整理,确定实体和关系,这一过程耗时费力且依赖专业知识。为解决这一问题,传统方法主要集中于基于语义模式学习逻辑规则。基于规则的方法利用词汇和语义角色标签提

文章图片
#知识图谱#人工智能#机器学习 +2
怎么部署一个私有大模型?

1、前段时间,ChatGPT、Midjourney 爆火之后,大家的焦点都集中在怎么基于这些工具来写作、画画和聊天。现在,随着国内大模型遍地开花,以及 Meta 公司开源的大模型效果越来越好,我知道,企业大规模应用的时机已然来临。2、换句话说,之前,更多人的焦点都是把 GPT 当成工作的提效工具,现在,随着大家理解的深入,。“AI 时代,所有产品都值得用大模型重新做一遍。”就像阿里巴巴集团 CEO

文章图片
#人工智能#AIGC#语言模型 +1
大模型智能体(LLM Agent)学习笔记

大模型对应的英文是Large Language Model(LLM),即大语言模型,简称大模型。技术层面讲,大模型是一种基于深度学习技术的机器学习模型。为什么叫大模型呢?它是相对于小模型而言的。传统的机器学习算法一般是解决某个特定领域的问题(例如文本分类),使用的训练数据集规模较小,参数也比较少。而大模型一般是基于互联网上的海量数据训练而成的,模型参数可达数十亿至数万亿。这些参数就像大脑中的神经元

文章图片
#学习#人工智能#语言模型 +1
EMNLP 2024 | 基于知识编辑的大模型敏感知识擦除

大模型(LLMs)的训练数据中可能包含敏感信息,例如个人隐私和受版权保护的内容,因此需要对这些知识进行有效擦除。然而,直接从预训练语料中移除相关数据并重新训练模型不仅成本高昂,且计算量巨大。为此,。现阶段的知识擦除评估范式难以区分敏感(如隐私、版权等)和通用知识。基于此,本文提出,用于更细致地评估版权内容和用户隐私领域的知识擦除方法,同时提出,利用梯度信息精确地定位和擦除敏感知识。本数据集分为版权

文章图片
#深度学习#机器学习#人工智能 +2
AgentWriter,让大模型输出万字长文,清华、智谱联合开源

今天看一下清华和智谱AI联合发布的这个新研究,如何通过Agent让LLM写出长达万词的长文!这可比写一篇毕业论文还要长呢!当前的长上下文大型语言模型 (LLM) 可以处理多达 100,000 个标记的输入,但难以生成超过 2,000 个单词的适度长度的输出。通过对照实验,我们发现模型的有效生成长度本质上受其在监督微调 (SFT) 期间看到的样本的限制。换言之,它们的输出限制是由于现有 SFT 数据

文章图片
#知识图谱#前端#html +2
本地部署AI大模型,既省钱又安全,1000元的旧电脑也能成为AI PC

该阶段让大家对大模型 AI有一个最前沿的认识,对大模型 AI 的理解超过 95% 的人,可以在相关讨论时发表高级、不跟风、又接地气的见解,别人只会和 AI 聊天,而你能调教 AI,并能用代码将大模型和业务衔接。对全球大模型从性能、吞吐量、成本等方面有一定的认知,可以在云端和本地等多种环境下部署大模型,找到适合自己的项目/创业方向,做一名被 AI 武装的产品经理。由于新岗位的生产效率,要优于被取代岗

文章图片
#人工智能#安全#java +4
    共 491 条
  • 1
  • 2
  • 3
  • 50
  • 请选择
OSZAR »