深度学习-131-RAG技术之基于Anything LLM搭建本地私人知识库的应用策略问题总结(二)

news/2025/2/27 23:42:32/

文章目录

  • 1 AnythingLLM是如何工作的
  • 2 AnythingLLM中的几个关键参数和配置
    • 2.1 分块处理
    • 2.2 Embedding嵌入模型
    • 2.3 TopK检索召回
    • 2.4 LLM 大模型首选项
    • 2.5 减少幻觉的设定技巧
  • 3 告别幻觉和睁眼说瞎话
    • 3.1 关键原则
    • 3.2 关键机理剖析
      • 3.2.1 Pin固定的含义
      • 3.2.2 Chunk Size与向量数Vector Count
      • 3.2.3 TopK检索召回片段数
  • 4 参考附录

1 AnythingLLM是如何工作的

在AnythingLLM中,我们不会读取您的整个文件系统,然后将其报告给LLM,因为它会浪费99%的时间。

相反,您的查询是根据您的文档文本矢量数据库处理的,我们会从被认为与您的提示 “相关” 的文档中取回4-6个文本块。

例如,假设你有一个包含数百个食谱的工作空间,不要问“给我3种高卡路里食物的标题”。这个LLM会断然拒绝这一点!但是为什么呢?

当你将检索增强生成(RAG)用于文档聊天机器人时,你的整个文档文本不可能适合大多数大语言模型(LLM)的上下文窗口。将文档分割成文本块,然后将这些文本块存储在向量数据库中,这样可以更容易地根据你的查询,用相关信息片段来 “增强” 大语言模型的基础知识。

在这里插入图片描述

让我们将AnythingLLM视为一个框架或管道。
(1)创建了一个工作区。
LLM只能看到嵌入在此工作区中的文档。如果未嵌入文档,LLM将无法查看或访问该文档的内容。
(2)您上传文档。
这使得 “移动到工作区” 或 “嵌入” 文档成为可能。上传会获取您的文档并将其转换为文


http://www.ppmy.cn/news/1575366.html

相关文章

2024/2/23 考试

第一题 One Clue 问题陈述 在数轴上有20000012000001块石头,这些石头的坐标分别为-1000000, -999999, -999998, \ldots, 999999, 1000000−1000000,−999999,−999998,…,999999,1000000。 其中,连续的KK块石头被涂成了黑色,其余的则是白…

Linux-IPC-消息队列

Linux IPC 之 消息队列(Message Queue) 在 Linux 中,消息队列(Message Queue) 是一种进程间通信(IPC)机制,允许进程通过一个消息队列在内核空间中交换数据。消息队列是基于 队列 数…

Java中JDK、JRE,JVM之间的关系

Java中的JDK、JRE和JVM是三个核心概念,其关系可概括为JDK > JRE > JVM,具体如下: 一、定义与作用 JDK(Java Development Kit) 定义:Java开发工具包,用于开发和编译Java程序。包含内容&…

C/C++ | 每日一练 (4)

💢欢迎来到张胤尘的技术站 💥技术如江河,汇聚众志成。代码似星辰,照亮行征程。开源精神长,传承永不忘。携手共前行,未来更辉煌💥 文章目录 C/C | 每日一练 (4)题目参考答案基础容器序列容器std:…

【DeepSeek】【GPT-Academic】:DeepSeek集成到GPT-Academic(官方+第三方)

目录 1 官方deepseek 1.1 拉取学术GPT项目 1.2 安装依赖 1.3 修改配置文件中的DEEPSEEK_API_KEY 2 第三方API 2.1 修改DEEPSEEK_API_KEY 2.2 修改CUSTOM_API_KEY_PATTERM 2.3 地址重定向 2.4 修改模型参数 2.5 成功调用 2.6 尝试添加一个deepseek-r1参数 3 使用千帆…

智能优化算法:雪橇犬优化算法(Sled Dog Optimizer,SDO)求解23个经典函数测试集,MATLAB

一、雪橇犬优化算法 算法简介:雪橇犬优化算法(Sled Dog Optimizer,SDO)是2024年10月发表于JCR1区、中科院1区SCI期刊《Advanced Engineering Informatics》的新型仿生元启发式算法。它模拟雪橇犬的拉雪橇、训练和退役行为构建模型…

基于springboot后台管理的校园网站系统(源码+lw+部署文档+讲解),源码可白嫖!

摘要 随着我国经济的高速发展与人们生活水平的日益提高,人们对生活质量的追求也多种多样。尤其在人们生活节奏不断加快的当下,人们更趋向于足不出户解决生活上的问题,线上管理系统展现了其蓬勃生命力和广阔的前景。与此同时,在此…

结构型模式 - 组合模式 (Composite Pattern)

结构型模式 - 组合模式 (Composite Pattern) 组合模式是一种结构型设计模式,它允许你将对象组合成树形结构以表示 “部分 - 整体” 的层次结构。组合模式使得用户对单个对象和组合对象的使用具有一致性。 经典的例子就是树形结构,里面可以是文件和文件夹的组合,文件…