本地部署deepseek-r1建立向量知识库和知识库检索实践【代码】

embedded/2025/3/18 14:47:58/

目录

一、本地部署DS

二、建立本地知识库

1.安装python和必要的库

2.设置主目录工作区

3.编写文档解析脚本

4.构建向量数据库

三、基于DS,使用本地知识库检索


本地部署DS,其实非常简单,我写了一篇操作记录,我终于本地部署了DeepSeek-R1(图文全过程)-CSDN博客

安装了本地DS,我肯定是想建立本地的知识库,还要能结合本地知识库来查询了,不然本地部署,并没有太大的意义,用户主要是不想把提问的附件和知识库送到服务器上,不管怎么样,辛辛苦苦写的论文,做的实验数据,还是不想哪天莫名其妙的被别人检索到的。

有兴趣,或者不想走弯路的朋友,可以看看。运行DS,肯定是很考验机器的,但并不是多么的可怕,没有GPU不要紧,CPU也能跑。我用一台Windows 10pro,没有GPU,跑起来虽然风扇呼呼的,但8b没有什么问题,7b估计更顺滑一些。我把网线拔了也实验了,确实是本地哈哈!上面的文章中,也给了不同版本DeepSeek-R1所需要的电脑配置清单,以及一个检测工具,还是挺好用的。

(我这台电脑的配置)

手头也没有什么好文章,于是就去问DS(满血版)自己,DS对于自己部署自己,给的代码和方式,不是模块不全,就是代码不对,要么是路径错误,把我这好久不碰代码的人,弄得迷迷糊糊,好在调程序的修养还在,不跑通,不出结果,心里痒痒的不行,于是反复提问DS,反复检查,终于也算是初步能看到结果了。

本文给出了解析本地知识库PDF文件、建立向量知识库、集成deepseek-r1:8b版本查询的全过程。

距离真正的商用,当然有距离,代码和示例的伪代码差不多,没有什么保护、架构可言,做一个记录,知行合一,自我启发是够用了。

一、本地部署DS

我部署的是8b版本,基于ollama部署的,很简单。

我终于本地部署了DeepSeek-R1(图文全过程)-CSDN博客

部署后,由于要运行python,所以我同时用的powershell和cmd

启动:

ollama run deepseek-r1:8b

很快就可以看到,deepseek-r1:8b版本,就开始运行 。

可以看一下版本。

如果不习惯命令行窗口,想要图形界面,大家还可以下载Docker,运行WebUI,可以试试。我的电脑windows一开始没有升级,无法安装最新的Docker,要升级到19045以上。

刚刚升级了windows,试了下安装成功!

WSL也同时被安装和升级。

这段后续再给大家分享。

二、建立本地知识库

我直接问的DS:

我用ollama已经在windows10环境下部署了deepseek-r1,现在想在本地建设知识库,把我的PDF和WORD等文件装入知识库,我该下载哪些工具和软件,执行哪些操作,需要清晰且可执行性强。我没有nvidia显卡,是共享的显存,但是我的deepseek可以运行,我不求效率和速度,能跑通就可以。

我真是要求不高了,因为确实害怕误导了它,给我放什么大招,我的小笔记本承受不住。

(以下很多内容是反复核实验勘误后的,DS的回答经常有问题。即使是满血版本。)

1.安装python和必要的库

https://www.python.org/downloads/windows/

我安装的版本是

Pyth


http://www.ppmy.cn/embedded/173619.html

相关文章

(性能测试)性能测试工具 2.jmeter的环境搭建 3jmeter元件和4使用实例 5jmeter元件和参数化

目录 性能测试工具 性能测试工具 jemeter环境搭建 jmeter的常用目录介绍 jmeter修改语言和主题--jmeter界面的汉化 jmeter元件 jmeter元件和组件的介绍 jmeter的作用域原则 jmeter的执行顺序 案例:执行顺序 jmeter使用案例 jmeter线程组的介绍 jmeter…

365天之第P10周:Pytorch实现车牌识别

365天之第P10周:Pytorch实现车牌识别 Pytorch实现车牌识别 365天之第P10周:Pytorch实现车牌识别一、导入数据1.获取类别名2. 数据可视化3. 标签数字化4. 加载数据文件5. 划分数据 二、自建模型三、 训练模型1. 优化器与损失函数2. 模型训练 四、 结果分析…

深入理解 C++20 中的 `std::shared_ptr` 原子操作

文章目录 1. std::shared_ptr 的线程安全问题2. std::shared_ptr 原子操作函数2.1 原子读取和存储2.2 原子交换2.3 原子比较交换 3. 注意事项4. 示例5. 总结 在多线程编程中,线程安全是一个至关重要的问题。C11 引入了 std::shared_ptr,它通过引用计数机…

【VS小知识】VS如何保存UTF8

之前由于用C#开发服务器,无意间发现VS保存的.cs文件不是UTF8编码的,虽然文件内看着是中文,但服务器传递给客户端的数据不是中文而是乱码。今天就来讲一下如何将VS保存为UTF8。话不多说直接开始。 问题表现 我们拿Unity举例。我们在脚本文件中…

RAGFlow部署与使用(开源本地知识库管理系统,包括kibana配置)

一、RAGFlow 简介 戳我访问RAGFlow RAGFlow 是一款基于深度文档理解构建的开源 RAG(Retrieval-Augmented Generation)引擎。它可以给我们搭建本地知识库,将用户的知识文档上传到RAGFlow后,通过文档切分、向量入库,在…

本地部署Deep Seek-R1,搭建个人知识库——笔记

目录 一、本地部署 DeepSeek - R1 1:安装Ollama 2:部署DeepSeek - R1模型 3:安装Cherry Studio 二、构建私有知识库 一、本地部署 DeepSeek - R1 1:安装Ollama 1.打开Ollama下载安装 未科学上网,I 先打开迅雷再下…

css模拟雷达扫描动画

<div class"radar-scan"><div class"radar-container" /></div> 样式&#xff1a; .radar-scan {background-image: linear-gradient(0deg,transparent 24%,rgba(32, 255, 77, 0.15) 25%,rgba(32, 255, 77, 0.15) 26%,transparent 27%,…

为wordpress核心functions文件瘦身

在wordpress主题开发过程中&#xff0c;常会用到functions.php这个文件&#xff0c;通过这个文件&#xff0c;可以让wordpress主题变得很强大。但是随着&#xff0c;功能的越来越多functions文件也会变得越来越臃肿庞大。要修改起functions文件来&#xff0c;也就越麻烦。特别是…