PrivateGPT:安全和私密的离线 GPT-4

news/2024/12/29 9:18:33/

在人工智能 (AI) 和自然语言处理 (NLP) 领域,隐私通常是一个基本问题,尤其是在处理敏感数据时。PrivateGPT 是这一领域的突破性发展,正面解决了这个问题。它旨在在没有互联网连接的情况下在本地运行,通过防止数据离开您的执行环境来确保完全隐私。

 

什么是私有 GPT?

PrivateGPT 是一种创新工具,它将 GPT-4 强大的语言理解能力与严格的隐私措施相结合。利用 LangChain、GPT4All、LlamaCpp、Chroma 和 SentenceTransformers 的优势,PrivateGPT 允许用户完全在本地与 GPT-4 进行交互。让我们深入研究设置 PrivateGPT 的细节以及如何有效地使用它。

设置 PrivateGPT:分步

设置 PrivateGPT 主要包括两个步骤:安装要求和配置环境。首先,确保您的计算机上安装了 Python 3.10 或更高版本。

第一步:安装依赖

pip3 install -r requirements.txt

第 2 步:下载语言学习模型 (LLM) 并将其放置在您选择的目录中。默认模型是ggml-gpt4all-j-v1.3-groovy.bin. 但是,可以使用任何 GPT4All-J 兼容模型。

第 3 步:重命名example.env.env编辑环境变量:

  • MODEL_TYPE:指定 LlamaCpp 或 GPT4All。
  • PERSIST_DIRECTORY:设置矢量存储的文件夹。
  • MODEL_PATH: 提供你的 LLM 的路径。
  • MODEL_N_CTX:确定 LLM 模型的最大令牌限制。
  • EMBEDDINGS_MODEL_NAME:指定 SentenceTransformers 嵌入模型名称。
  • TARGET_SOURCE_CHUNKS:确定将用于回答问题的块数。

随着环境的建立,我们现在可以继续摄取数据。

使用 PrivateGPT 摄取数据

PrivateGPT 支持各种文件类型,从 CSV、Word 文档到 HTML 文件等等。以下是您摄取自己的数据的方式:

第 1 步:将文件放入source_documents目录

第二步:运行ingest.py脚本处理所有数据

python ingest.py

该脚本在文件夹中创建一个本地嵌入数据库db。每个文档大约需要 20-30 秒,具体取决于文档大小。

与 PrivateGPT 交互

现在,让我们深入探讨如何使用 PrivateGPT 在本地对文档提问:

第 1 步:运行privateGPT.py脚本:

python privateGPT.py

第 2 步:出现提示时,输入您的查询。

在 20-30 秒内,根据您机器的速度,PrivateGPT 使用 GPT-4 模型生成一个答案,并提供它从您的文档中使用的来源来创建响应。

释放 PrivateGPT 的力量:底层机制

PrivateGPT 的隐私保护本地操作由强大工具的组合提供支持。ingest.py利用 LangChain 工具解析文档,使用 HuggingFaceEmbeddings(SentenceTransformers 的一部分)创建本地嵌入。生成的嵌入存储在具有色度矢量存储的本地矢量数据库中。

privateGPT.py使用本地 LLM——GPT4All-J 或 LlamaCpp——来理解用户查询并制作合适的响应。本地向量存储用于提取这些响应的上下文,利用相似性搜索从摄取的文档中找到相应的上下文。

系统要求和故障排除

PrivateGPT 的系统先决条件包括 Python 3.10 或更高版本。在 pip 安装过程中,如果出现 C++ 编译器错误,则会提供适用于 Windows 10/11 和运行 Intel 的 Mac 的安装说明。

您可以在此处访问 PrivateGPT GitHub(在新标签页中打开).

结论

PrivateGPT 证明了强大的人工智能语言模型(如 GPT-4)与严格的数据隐私协议的融合。它为用户提供了一个安全的环境来与他们的文档进行交互,确保没有数据被外部共享。无论您是 AI 爱好者还是注重隐私的用户,PrivateGPT 都为保护隐私的 AI 应用程序开辟了新的可能性。


http://www.ppmy.cn/news/387290.html

相关文章

使用resize属性实现元素拖拉改变宽度

1.背景 地图页面左侧全量树新需求,想要实现左侧树的拖拉效果,方便用户使用。 查阅资料发现使用js逻辑,通过监听鼠标按下、移动、抬起事件等进行处理可以实现,但是考虑到地图页面的性能已经吃不消了,于是不使用此方法…

输入前序遍历,还原二叉树并返回中序遍历

第一步:对二叉树的结点进行定义,在TreeNode中保存 第二步:根据前序遍历还原二叉树createTable定义一个index表示在前序遍历中遍历过的元素的位置谦虚遍历数组String str1.空树,2.如果index小于数组str长度并且值不是#,…

Meta NMT / Speech - 小记

文章目录 Mata Blog :USTSpeechMatrix 语音到语音翻译语料库FLORES 数据集M2M-100 模型LASER 数据挖掘VoxPopuliCCMatrixCCAlignedXLS-RWav2vec 2.0NLLB-200Mata Blog : https://ai.facebook.com/blog/ https://research.facebook.com/research-areas/

显卡驱动卸载工具DDU

文章目录 工具介绍 使用步骤 工具介绍 安装显卡驱动、CUDA、CUDNN时经常碰到安装失败情况,很多时候因为卸载之前版本卸载不干净; DDU(Display Driver Uninstaller)比较实用,可以卸载的比较干净;支持市面…

使用ATI显卡的同志们请看这里

看来用ATI显卡的人还是不少的,像8500这样的经典显卡如果不能在X下运行3D游戏实在可惜了。 !!说明1:本文只适用于8500及以上显卡,ATI 官方并未提及对Radeon / 7000 / 7200/ 7500的支持。 !!说明2…

NVIDIA卡和ATI卡的对比,以及如何判断 N卡 和 A卡 每个型号的含义:

这里是我写的一个 英伟达显卡学习的 导航目录,欢迎大家点击观看,希望可以给您带来好处: 学习导航目录: N卡和A卡的对比: 他们各有千秋,只做对比,不评价谁好谁坏!!&…

主流显卡Linux驱动安装-Intel、ATi篇(图)

主流显卡Linux驱动安装-Intel、ATi篇(图)时间:2005-10-25 作者:ChinaITLab.com 来源:ChinaITLab.com Intel 集成显卡的Linux驱动安装    目前使用Intel 集成显卡的计算机主要集中在中低端商务台式机和中低端笔记本电脑。这里介绍一下Linu…

ATI移动显卡全系列型号及参数一览表

ATI Radeon系列和X系列无疑已经被本友们广为所知。前者ATI Radeon(俗称“镭”)诞生于2000年4月,是ATI AGP接口时代的开山之作。应该说,也就是从“Radeon”系列开始,ATI的笔记本芯片正式走上与品牌机平行前进的路线。Mo…