【AI】本地部署可以与文件沟通的GPT:Llama 2 + GPT4All + Chroma

server/2024/10/21 2:40:52/

【背景】

还是继续致力于实践可以保护数据隐私的本地化LLM部署。
这次用的是Llama 2 + GPT4All + Chroma实现RAG。

【概念】

基于LangChain模板的各个部分的作用:

  1. Llama2-》语言模型管理
  2. GPT4ALL-》embedding
  3. Chroma-》文件内容的向量存储,作为内部知识库,不需要网络就可以存储。

【环境构建】

  1. 安装Ollama
    在Linux或Windows的WSL下,使用命令:
curl https://ollama.ai/install.sh | sh
  1. 利用Ollama下载一款LLM模型
    比如,下载一个llama2 7b chat模型:
ollama pull llama2:7b-chat
  1. 安装LangChain命令行工具CLI:
pip install -U langchain-cli

http://www.ppmy.cn/server/4921.html

相关文章

vue.runtime.esm.js?c320:4625 [Vue warn]: Failed to resolve directive: lazy

使用图片懒加载插件报错 原因:vue2与懒加载插件默认版本不相容导致的 解决方法:重新安装lazyLoad npm install vue-lazyload1.3.3 --save-dev

esp32-通过wifi使用timelib库同步时间(三)

库的安装 本文基于platformIO,安装较为简单如下图 实例代码 完整代码如下,如果时间获取超时请使用time1.aliyun.com获取时间。 /** Time_NTP.pde* Example showing time sync to NTP time source** This sketch uses the Ethernet library*/#include …

OpenHarmony开发实例:【新闻客户端】

介绍 本篇Codelab我们将教会大家如何构建一个简易的OpenHarmony新闻客户端(JS版本)。应用包含两级页面,分别是主页面和详情页面,两个页面都展示了丰富的UI组件,其中详情页的实现逻辑中还展示了如何通过调用相应接口&a…

机器学习周报第37周

目录 一、文献阅读:You Only Look Once: Unified, Real-Time Object Detection1.1 摘要1.2 背景1.3 论文模型1.4 网络设计1.5 YOLO的局限性1.6 实现代码 一、文献阅读:You Only Look Once: Unified, Real-Time Object Detection 1.1 摘要 YOLO是一种新…

GRAF: Generative Radiance Fields for 3D-Aware Image Synthesis

GRAF: Generative Radiance Fieldsfor 3D-Aware Image Synthesis(基于产生辐射场的三维图像合成) 思维导图:https://blog.csdn.net/weixin_53765004/article/details/137944206?csdn_share_tail%7B%22type%22%3A%22blog%22%2C%22rType%22%3…

如何在PPT中获得网页般的互动效果

如何在PPT中获得网页般的互动效果 效果可以看视频 PPT中插入网页有互动效果 当然了,获得网页般的互动效果,最简单的方法就是在 PPT 中插入网页呀。 那么如何插入呢? 接下来为你讲解如何获得(此方法在 PowerPoint中行得通&#…

MySQL数据库外键约束打开与关闭 ️

MySQL数据库外键约束打开与关闭 🛠️ MySQL数据库外键约束打开与关闭 🛠️摘要 📝引言 🚀正文内容(详细介绍) 💡关闭外键约束检查外键约束检查关闭的作用风险与最佳实践建议 🤔 QA环…

03.卸载MySQL

卸载MySQL 1.Windows卸载MySQL8 停止服务 用命令停止或者在服务中停止都可以 net stop mysql(服务名字可以去服务里面看一下)控制面板卸载MySQL 卸载MySQL8.0的程序可以和其他桌面应用程序一样直接在控制面板选择卸载程序,并在程序列表中…