本地基于知识库的大模型的使用教程

news/2024/9/24 23:40:46/

本地基于知识库的大模型的使用教程

启动

双击 大模型启动.bat文件,内容如下:

cmd /k "cd /d G:\Anaconda3\Scripts && activate.bat && cd /d D:\docdb_llm && conda activate python3.11 && python startup.py --all-webui --model-name Qwen-1_8B-Chat

参数解读

  1. –model-name:可以选择选择不同的模型,目前支持
  2. –all-webui:启动webui界面。不需要修改

知识库管理

  1. 选择对应的知识库

    image-20240502230421574

  2. 上传文件,大小最好不要超过20mb,否则显存不够。pdf最好是纯文本形式

    image-20240502230526787

  3. 输入知识库的介绍

    image-20240502230600203

  4. 单段文本最大长度:大模型每批次嵌入的文本大小,数值越大,消耗的显存越多。相邻文本重合长度:每相邻的两个文本段之间重合的部分,数值越大,两文本段语义关联程度越高。

    image-20240502230852809

  5. 点击添加到知识库,文件添加到源码的knowledge_base/samples/content 文件夹下面。samples:对应的知识库名字。

    image-20240502230927191

    image-20240502230955246

  6. 选择一条文件,显示文档加载器列为空白,说明文档没有嵌入到向量数据库的,需要点击重新添加至向量数据库。从向量数据库删除:文件数据从量数据库中删除,但知识库的content目录下还有源文件。从知识库中删除:删除content下的源文件。

    image-20240502231206500

  7. 如果第一次启动项目,之前没有知识库,推荐使用将需要上传的文件放入 知识库名称/content/ 下,点击从源文件重建数据库,即可将所有文件嵌入到向量数据库,文件多的化,运行时间会比较久(跟文件的质量也有关系,如果很多图片pdf需要orc,也会很占时间和显存)。以后每次添加新文件可以使用步骤6的方法。如果已有知识库,点击此按钮会将之前的所有文件重新向量化,比较耗时间。建议少量的添加文件使用步骤6。

    image-20240502231631098

  8. 可视化修改知识库里的文件内容(如果orc识别的文件,可能会出现需要错误的问题,所以高质量的文档很重要)

    image-20240502232241340

大模型对话

参数解释:

  1. 选择模型:可以切换模型
  2. 选择prompt模板,可以修改大模型指令。默认即可。
  3. temperature:大模型回答的随机性,数值越大,回答的创造性(随机性)越高
  4. 历史对话轮数:数值越大,上下文关联的历史对话轮数越高,消耗的显存也高。
  5. =择知识库:选择要问答的知识库
  6. 匹配知识条数:匹配的知识库内容个数,大模型将结合匹配的内容回答问题。数据越高,消耗的显存也高。
  7. 知识匹配分数阈值:用于确定两个知识实体是否匹配。默认1即可。

image-20240502232345012

对话内容

上面是对问题的回答,下面知识库匹配的结果是匹配到的知识库内容

image-20240502233232151


http://www.ppmy.cn/news/1451279.html

相关文章

如何解决Go中uint类型溢出问题

如何解决Go中uint类型溢出问题 Golong的uint类型溢出问题通常会发生在大量的运算中,特别是涉及到大量循环和大数运算中。当uint类型的值超过其最大值时,会发生溢出,从最小值开始循环,一般有如下几种解决办法: 1. 使用…

wordpress外贸独立站建站10要10不要

创建一个成功的WordPress外贸独立站需要注意很多因素。以下是zhanyes根据多年建站经验总结的wordpress外贸独立站建站的10个建议和10个避免的事项,以帮助您建立一个高质量的外贸网站: 10个要: 1. 要选择合适的域名:确保您的域名…

感应开关盖垃圾桶项目(二)

单片机中断 之前我们采用软件的方法实现,对爆表的次数进行统计,以达到我们的延时要求。我们也可以采取中断的方法,让硬件直接实现中断。 观察中断结构图可以发现只有当EA闭合的时候,才会接受中断信号,之后可以按照我…

如何在postman上提交文件格式的数据

如何在postman上提交文件格式的数据 今天在写一个文件上传的功能接口时,想用postman进行提交,花了些时间才找到在postman提交文件格式的数据。记录一下吧! 1.打开postman,选择POST提交方式,然后在Params那一行的Head…

npm许可证检查

node开发做项目,很少有人去纯手工打造,大多是采用一些开源框架,还会使用前人做好的轮子,所以咱们的项目文件里,除了自己编写的js文件,还会带有一些拿来主义的npm模块,从其他开源发布网站上下载的…

去中心化自治组织(DAO)

文章目录 一、DAO (Decentralized Autonomous Organization) 去中心化自治组织 二、举例说明 1、例子1 2、例子2 总结 一、DAO (Decentralized Autonomous Organization) 去中心化自治组织 DAO是一种基于区块链平台上的组织结构,它通过智能合约来实现组织的…

数据结构---线性表(顺序表)附代码

目录: 数据结构相关概念 1、什么是数据结构? 2、为什么需要数据结构? 顺序表 1、顺序表的概念及结构 1.1 线性表 1.2 顺序表 2、顺序表分类 3、动态顺序表的实现 什么是数据结构?? 数据结构是由 “数据”和 …

小剧场短剧影视小程序源码_后端PHP

项目运行截图 源码贡献 https://githubs.xyz/boot?app42 部署说明 linux/win任选 PHP版本:7.3/7.2(测试时我用的7.2要安装sg扩展 ) 批量替换域名http://video.owoii.com更换为你的 批量替换域名http://120.79.77.163:1更换为你的 这两个…