本地部署deepseek-r1建立向量知识库和知识库检索实践【代码】

devtools/2025/3/20 2:51:13/

目录

一、本地部署DS

二、建立本地知识库

1.安装python和必要的库

2.设置主目录工作区

3.编写文档解析脚本

4.构建向量数据库

三、基于DS,使用本地知识库检索


本地部署DS,其实非常简单,我写了一篇操作记录,我终于本地部署了DeepSeek-R1(图文全过程)-CSDN博客

安装了本地DS,我肯定是想建立本地的知识库,还要能结合本地知识库来查询了,不然本地部署,并没有太大的意义,用户主要是不想把提问的附件和知识库送到服务器上,不管怎么样,辛辛苦苦写的论文,做的实验数据,还是不想哪天莫名其妙的被别人检索到的。

有兴趣,或者不想走弯路的朋友,可以看看。运行DS,肯定是很考验机器的,但并不是多么的可怕,没有GPU不要紧,CPU也能跑。我用一台Windows 10pro,没有GPU,跑起来虽然风扇呼呼的,但8b没有什么问题,7b估计更顺滑一些。我把网线拔了也实验了,确实是本地哈哈!上面的文章中,也给了不同版本DeepSeek-R1所需要的电脑配置清单,以及一个检测工具,还是挺好用的。

(我这台电脑的配置)

手头也没有什么好文章,于是就去问DS(满血版)自己,DS对于自己部署自己,给的代码和方式,不是模块不全,就是代码不对,要么是路径错误,把我这好久不碰代码的人,弄得迷迷糊糊,好在调程序的修养还在,不跑通,不出结果,心里痒痒的不行,于是反复提问DS,反复检查,终于也算是初步能看到结果了。

本文给出了解析本地知识库PDF文件、建立向量知识库、集成deepseek-r1:8b版本查询的全过程。

距离真正的商用,当然有距离,代码和示例的伪代码差不多,没有什么保护、架构可言,做一个记录,知行合一,自我启发是够用了。

一、本地部署DS

我部署的是8b版本,基于ollama部署的,很简单。

我终于本地部署了DeepSeek-R1(图文全过程)-CSDN博客

部署后,由于要运行python,所以我同时用的powershell和cmd

启动:

ollama run deepseek-r1:8b

很快就可以看到,deepseek-r1:8b版本,就开始运行 。

可以看一下版本。

如果不习惯命令行窗口,想要图形界面,大家还可以下载Docker,运行WebUI,可以试试。我的电脑windows一开始没有升级,无法安装最新的Docker,要升级到19045以上。

刚刚升级了windows,试了下安装成功!

WSL也同时被安装和升级。

这段后续再给大家分享。

二、建立本地知识库

我直接问的DS:

我用ollama已经在windows10环境下部署了deepseek-r1,现在想在本地建设知识库,把我的PDF和WORD等文件装入知识库,我该下载哪些工具和软件,执行哪些操作,需要清晰且可执行性强。我没有nvidia显卡,是共享的显存,但是我的deepseek可以运行,我不求效率和速度,能跑通就可以。

我真是要求不高了,因为确实害怕误导了它,给我放什么大招,我的小笔记本承受不住。

(以下很多内容是反复核实验勘误后的,DS的回答经常有问题。即使是满血版本。)

1.安装python和必要的库

https://www.python.org/downloads/windows/

我安装的版本是

Pyth


http://www.ppmy.cn/devtools/168511.html

相关文章

手机蓝牙项目

一.蓝牙模块连接 首先将蓝牙模块与ch340模块连接然后打开串口软件调号参数。之后发送指令AT看是否有回复OK,有则连接成功,无说明串口没有连接好。 二.修改波特率 连接没有问题去查看波特率,然后修改波特率为我们串口代码写的,波…

YOLOv11小白的进击之路(九)创新YOLO11损失函数之NWD损失函数源码解读

之前的博客也有对YOLO11的损失函数进行过源码分析,可以参考:YOLOv11小白的进击之路(六)创新YOLO的iou及损失函数时的源码分析_yolov11的损失函数是什么-CSDN博客最近在做小目标检测的时候注意到了NWD损失函数,这里对其…

【课堂笔记】定理:样本越多,测量的经验损失越接近真实损失

定理描述 给定一个模型 f : X → Y f:X \to Y f:X→Y,设数据分布 D \mathcal{D} D定义在 X Y X \times Y XY,表示数据真实分布,且假设训练集和测试集的样本均从 D \mathcal{D} D中独立同分布(i.i.d)抽取。   设损失函数为 l : Y Y → R l…

Go红队开发—日志打印优化

文章目录 日志log输出打印日志控制测试源码 slog输出打印修改默认等级修改输出目的自定义logger添加日志细节子logger 日志颜色修改源码 各位师傅exp与poc编写暂时鸽了,感觉web编程那章节学完自己就能编写,想不出有什么能够学习的地方,因为po…

[网络][tcp协议]:tcp报头

tcp(传输控制协议)是一种面向字节流的传输层协议,相较于udp协议,tcp能保证传输数据的可靠性与准确性,tcp也是目前最常见的传输层协议 本文主要介绍tcp报头各个字段的含义与用途 注:保留6位和6位标记位是目前最普遍的写法,在我查资料时,发现有一些拓展情况,会在后文细说 最简单的…

算法刷题记录——LeetCode篇(6) [第501~600题](持续更新)

(优先整理热门100及面试150,不定期持续更新,欢迎关注) 543. 二叉树的直径 给你一棵二叉树的根节点,返回该树的 直径 。 二叉树的 直径 是指树中任意两个节点之间最长路径的 长度 。这条路径可能经过也可能不经过根节点 root 。 两节点之间路…

爬虫逆向:详细讲述iOS底层原理及机制

更多内容请见: 爬虫和逆向教程-专栏介绍和目录 文章目录 1. iOS 系统架构1.1 Core OS 层1.2 Core Services 层1.3 Media 层1.4 Cocoa Touch 层2. iOS 的核心机制2.1 应用生命周期2.2 内存管理2.3 多线程2.4 文件系统2.5 网络通信3. iOS 的启动流程4. iOS 的安全机制4.1 代码签…

LabVIEW烟气速度场实时监测

本项目针对燃煤电站烟气流速实时监测需求,探讨了静电传感器结构与速度场超分辨率重建方法,结合LabVIEW多板卡同步采集与实时处理技术,开发出一个高效的烟气速度场实时监测系统。该系统能够在高温、高尘的复杂工况下稳定运行,提供高…