深度学习-107-RAG技术之基于Cherry Studio和Anything LLM搭建本地私人知识库的效果并不理想

devtools/2025/2/12 9:56:59/

文章目录

  • 1 RAG技术背景
    • 1.1 RAG原理
    • 1.2 技术选型
  • 2 基于Cherry Studio搭建
    • 2.1 Ollama下载嵌入模型和大模型
    • 2.2 配置接入本地ollama
    • 2.3 配置知识库
    • 2.4 添加知识文档
    • 2.5 搜索知识库
    • 2.6 接入大模型处理
      • 2.6.1 deepseek-r1:1.5b(效果差)
      • 2.6.2 qwen2:7b(效果好)
  • 3 基于AnythingLLM搭建
    • 3.1 配置大模型
    • 3.2 配置向量数据库和嵌入模型
    • 3.3 配置工作区
    • 3.4 上传知识库文档
    • 3.5 文档移到工作空间
    • 3.6 点击图钉按钮
    • 3.7 聊天响应
  • 4 效果评价
    • 4.1 原因分析
    • 4.2 改进建议
  • 5 参考附录

RAG_1">1 RAG技术背景

初期接触LLM即大语言模型,觉得虽然很强大,但是有时候AI会一本正经的胡说八道,这种大模型的幻觉对于日常使用来说具有很大的误导性,特别是如果我们要用在生成环境下,由于缺少精确性而无法使用。

为什么会造成这种结果那,简单来说就是模型是为了通用性设计的,缺少相关知识,所以导致回复的结果存在胡说八道的情况,根据香农理论,减少信息熵,就需要引入更多信息。

从这个角度来说,就有两个途径:
一是重新利用相关专业知识再次训练加强模型,或进行模型微调, 模型训练的成本是巨大的,微调也需要重新标记数据和大量的计算资源,对于个人来说基本不太现实。
二是在问LLM问题的时候,增加些知识背景,让模型可以根据这些知识背景来回复问题;后者即是知识库的构建原理了。

有个专门的概念叫RAG(Retrieval-Augmented Generation),即检索增强生成,是一种结合检索技术和生成模型的技术框架,旨在提升模型生成内容的准确性和相关性。其核心思想是:在生成答案前,先从外部知识库中检索相关信息,再将检索结果与用户输入结合,指导生成模型输出更可靠的回答。

RAG_11">1.1 RAG原理


http://www.ppmy.cn/devtools/157784.html

相关文章

Level DB --- Iterator

Iterator是Level DB中的一个基类,它定义了迭代器的基础的操作,同时对内存资源进行了维护。 虚函数 Iterator类中的虚函数操作如下: virtual ~Iterator();// An iterator is either positioned at a key/value pair, or// not valid. This …

webpack配置方式

1. 基本配置文件 (webpack.config.js)(导出一个对象) 最常见的方式是通过 webpack.config.js 文件来配置 Webpack,导出一个对象。你可以在这个文件中导出一个配置对象,指定入口、输出、加载器、插件等。 // webpack.config.js m…

13vue3实战-----退出登录和记住密码功能

13vue3实战-----退出登录功能和记住密码功能 1.退出登录功能2.记住密码功能 1.退出登录功能 退出登录主要做两件事情:清除token等用户信息并且跳转路由到登录页面。 <script setup lang"ts"> import { useRouter } from vue-router import { LOGIN_TOKEN } f…

ubuntu和手机之间如何传递消息

在Ubuntu和手机之间传递消息可以通过以下几种方式实现&#xff1a; 1. 使用KDE Connect 安装KDE Connect&#xff1a; 在Ubuntu上安装KDE Connect&#xff1a;sudo apt update sudo apt install kdeconnect在手机上安装KDE Connect应用&#xff08;Android或iOS&#xff09;。…

第433场周赛:变长子数组求和、最多 K 个元素的子序列的最值之和、粉刷房子 Ⅳ、最多 K 个元素的子数组的最值之和

Q1、变长子数组求和 1、题目描述 给你一个长度为 n 的整数数组 nums 。对于 每个 下标 i&#xff08;0 < i < n&#xff09;&#xff0c;定义对应的子数组 nums[start ... i]&#xff08;start max(0, i - nums[i])&#xff09;。 返回为数组中每个下标定义的子数组中…

DeepSeek图解10页PDF

以前一直在关注国内外的一些AI工具&#xff0c;包括文本型、图像类的一些AI实践&#xff0c;最近DeepSeek突然爆火&#xff0c;从互联网收集一些资料与大家一起分享学习。 本章节分享的文件为网上流传的DeepSeek图解10页PDF&#xff0c;免费附件链接给出。 1 本地 1 本地部…

go-elasticsearch创建ik索引并进行查询操作

es-go client引入gomod go get github.com/elastic/go-elasticsearch/v8latest连接es服务器&#xff08;不经过安全校验) cfg : elasticsearch.Config{Addresses: []string{"http://localhost:9200",}, } es, err : elasticsearch.NewClient(cfg) if err ! nil {pa…

初窥强大,AI识别技术实现图像转文字(OCR技术)

⭐️⭐️⭐️⭐️⭐️欢迎来到我的博客⭐️⭐️⭐️⭐️⭐️ &#x1f434;作者&#xff1a;秋无之地 &#x1f434;简介&#xff1a;CSDN爬虫、后端、大数据、人工智能领域创作者。目前从事python全栈、爬虫和人工智能等相关工作&#xff0c;主要擅长领域有&#xff1a;python…