深度学习-131-RAG技术之基于Anything LLM搭建本地私人知识库的应用策略问题总结(二)

深度学习-131-RAG技术之基于Anything LLM搭建本地私人知识库的应用策略问题总结(二)

news/2025/2/27 23:42:32/

文章目录

1 AnythingLLM是如何工作的
2 AnythingLLM中的几个关键参数和配置
- 2.1 分块处理
- 2.2 Embedding嵌入模型
- 2.3 TopK检索召回
- 2.4 LLM 大模型首选项
- 2.5 减少幻觉的设定技巧
3 告别幻觉和睁眼说瞎话
- 3.1 关键原则
- 3.2 关键机理剖析
- - 3.2.1 Pin固定的含义
  - 3.2.2 Chunk Size与向量数Vector Count
  - 3.2.3 TopK检索召回片段数
4 参考附录

1 AnythingLLM是如何工作的

在AnythingLLM中，我们不会读取您的整个文件系统，然后将其报告给LLM，因为它会浪费99%的时间。

相反，您的查询是根据您的文档文本矢量数据库处理的，我们会从被认为与您的提示 “相关” 的文档中取回4-6个文本块。

例如，假设你有一个包含数百个食谱的工作空间，不要问“给我3种高卡路里食物的标题”。这个LLM会断然拒绝这一点！但是为什么呢？

当你将检索增强生成(RAG)用于文档聊天机器人时，你的整个文档文本不可能适合大多数大语言模型(LLM)的上下文窗口。将文档分割成文本块，然后将这些文本块存储在向量数据库中，这样可以更容易地根据你的查询，用相关信息片段来 “增强” 大语言模型的基础知识。

在这里插入图片描述

让我们将AnythingLLM视为一个框架或管道。
(1)创建了一个工作区。
LLM只能看到嵌入在此工作区中的文档。如果未嵌入文档，LLM将无法查看或访问该文档的内容。
(2)您上传文档。
这使得 “移动到工作区” 或 “嵌入” 文档成为可能。上传会获取您的文档并将其转换为文

http://www.ppmy.cn/news/1575366.html

相关文章

2024/2/23 考试

2024/2/23 考试

第一题 One Clue 问题陈述在数轴上有20000012000001块石头，这些石头的坐标分别为-1000000, -999999, -999998, \ldots, 999999, 1000000−1000000,−999999,−999998,…,999999,1000000。其中，连续的KK块石头被涂成了黑色，其余的则是白…

阅读更多...

Linux-IPC-消息队列

Linux-IPC-消息队列

Linux IPC 之消息队列（Message Queue） 在 Linux 中，消息队列（Message Queue） 是一种进程间通信（IPC）机制，允许进程通过一个消息队列在内核空间中交换数据。消息队列是基于队列数…

阅读更多...

Java中JDK、JRE，JVM之间的关系

Java中JDK、JRE，JVM之间的关系

Java中的JDK、JRE和JVM是三个核心概念，其关系可概括为JDK > JRE > JVM，具体如下： 一、定义与作用 JDK（Java Development Kit） 定义：Java开发工具包，用于开发和编译Java程序。包含内容&…

阅读更多...

C/C++ | 每日一练 (4)

C/C++ | 每日一练 (4)

💢欢迎来到张胤尘的技术站 💥技术如江河，汇聚众志成。代码似星辰，照亮行征程。开源精神长，传承永不忘。携手共前行，未来更辉煌💥 文章目录 C/C | 每日一练 (4)题目参考答案基础容器序列容器std:…

阅读更多...

【DeepSeek】【GPT-Academic】:DeepSeek集成到GPT-Academic（官方+第三方）

【DeepSeek】【GPT-Academic】:DeepSeek集成到GPT-Academic（官方+第三方）

目录 1 官方deepseek 1.1 拉取学术GPT项目 1.2 安装依赖 1.3 修改配置文件中的DEEPSEEK_API_KEY 2 第三方API 2.1 修改DEEPSEEK_API_KEY 2.2 修改CUSTOM_API_KEY_PATTERM 2.3 地址重定向 2.4 修改模型参数 2.5 成功调用 2.6 尝试添加一个deepseek-r1参数 3 使用千帆…

阅读更多...

智能优化算法：雪橇犬优化算法（Sled Dog Optimizer，SDO）求解23个经典函数测试集，MATLAB

智能优化算法：雪橇犬优化算法（Sled Dog Optimizer，SDO）求解23个经典函数测试集，MATLAB

一、雪橇犬优化算法算法简介：雪橇犬优化算法（Sled Dog Optimizer，SDO）是2024年10月发表于JCR1区、中科院1区SCI期刊《Advanced Engineering Informatics》的新型仿生元启发式算法。它模拟雪橇犬的拉雪橇、训练和退役行为构建模型…

阅读更多...

基于springboot后台管理的校园网站系统(源码+lw+部署文档+讲解)，源码可白嫖!

基于springboot后台管理的校园网站系统(源码+lw+部署文档+讲解)，源码可白嫖!

摘要随着我国经济的高速发展与人们生活水平的日益提高，人们对生活质量的追求也多种多样。尤其在人们生活节奏不断加快的当下，人们更趋向于足不出户解决生活上的问题，线上管理系统展现了其蓬勃生命力和广阔的前景。与此同时，在此…

阅读更多...

结构型模式 - 组合模式 (Composite Pattern)

结构型模式 - 组合模式 (Composite Pattern)

结构型模式 - 组合模式 (Composite Pattern) 组合模式是一种结构型设计模式，它允许你将对象组合成树形结构以表示 “部分 - 整体” 的层次结构。组合模式使得用户对单个对象和组合对象的使用具有一致性。经典的例子就是树形结构,里面可以是文件和文件夹的组合,文件…

阅读更多...

最新文章