DeepSeek R1学习入门

devtools/2025/3/5 10:13:13/

一、什么是 DeepSeek R1

2025.01.20 DeepSeek-R1 发布,DeepSeek R1 是 DeepSeek AI 开发的第一代推理模型,擅长复杂的推理任务,官方对标OpenAI o1正式版。适用于多种复杂任务,如数学推理、代码生成和逻辑推理等。

根据官方信息DeepSeek R1 可以看到提供多个版本,包括完整版(671B 参数)和蒸馏版(1.5B 到 70B 参数)。完整版性能强大,但需要极高的硬件配置;蒸馏版则更适合普通用户,硬件要求较低

DeepSeek-R1官方地址:https://github.com/deepseek-ai/DeepSeek-R1

完整版(671B):需要至少 350GB 显存/内存,适合专业服务器部署


蒸馏版:基于开源模型(如 QWEN 和 LLAMA)微调,参数量从 1.5B 到 70B 不等,适合本地硬件部署。


蒸馏版与完整版的区别


这里我们详细看下蒸馏版模型的特点

蒸馏版与量化版

例如:

deepseek-r1:7b-qwen-distill-q4_K_M:7B 模型的蒸馏+量化版本,显存需求从 5GB 降至 3GB。

deepseek-r1:32b-qwen-distill-q4_K_M:32B 模型的蒸馏+量化版本,显存需求从 22GB 降至 16GB

我们正常本地部署使用蒸馏版就可以

二、型号和硬件要求

硬件配置说明

1、Linux 配置:

最低要求:NVIDIA GTX 1660 6GB 或 AMD RX 5500 4GB,16GB 内存,50GB 存储空间

推荐配置:NVIDIA RTX 3060 12GB 或 AMD RX 6700 10GB,32GB 内存,100GB NVMe SSD

高性能配置:NVIDIA A100 40GB 或 AMD MI250X 128GB,128GB 内存,200GB NVMe SSD

2、Windows

最低要求:NVIDIA GTX 1650 4GB 或 AMD RX 5500 4GB,16GB 内存,50GB 存储空间

推荐配置:NVIDIA RTX 3060 12GB 或 AMD RX 6700 10GB,32GB 内存,100GB NVMe SSD

高性能配置:NVIDIA RTX 3090 24GB 或 AMD RX 7900 XTX 24GB,64GB 内存,200GB NVMe SSD

3、Mac 配置:

最低要求:M2 MacBook Air(8GB 内存)

推荐配置:M2/M3 MacBook Pro(16GB 内存)

高性能配置:M2 Max/Ultra Mac Studio(64GB 内存)

三、本地安装 DeepSeek R1

演示环境:M2/M3/M4 MacBook Pro (16GB RAM+)
模型:deepseek-r1:8b

本地部署的好处:

隐私:您的数据保存在本地的设备上,不会通过外部服务器

离线使用:下载模型后无需互联网连接

经济高效:无 API 成本或使用限制

低延迟:直接访问,无网络延迟

自定义:完全控制模型参数和设置

3.1 部署工具

部署可以使用 Ollama、LM Studio、Docker 等进行部署

1、Ollama:

支持 Windows、Linux 和 Mac 系统,提供命令行和 Docker 部署方式

使用命令 ollama run deepseek-r1:7b下载并运行模型

2、LM Studio:

支持 Windows 和 Mac,提供可视化界面,适合新手用户

支持 CPU+GPU 混合推理,优化低配硬件性能

LM Studio 是一个桌面应用程序,它提供了一个用户友好的界面,允许用户轻松下载、加载和运行各种语言模型(如 LLaMA、GPT 等)

3、Docker:

支持 Linux 和 Windows,适合高级用户。

使用命令 docker run -d --gpus=all -p 11434:11434 --name ollama ollama/ollama 启动容器。

由于需要本地化部署语言模型的场景,对数据隐私和自定义或扩展语言模型功能有较高要求,我们这里使用 Ollama 来进行本地部署运行

如果只有集显也想试试玩,可以试试下载 LM Studio 软件,更适应新手。

3.2 安装 Ollama

官方地址:https://ollama.com/

安装模型:
回到 Ollama 官网选择模型,选择适合你的蒸馏量化模型复制命令进行安装

可以看到安装完成

在使用过程中,注意查看硬件使用率,GPU是否饱和,其他使用率不是很高,速度也很快

四、可视化界面

这里介绍下 Open-WebUI 和 Dify。

Open-WebUI 是一款自托管 LLM Web 界面,提供 Web UI 与大模型交互,仅提供 Web UI,不提供 API,适用于个人使用 LLM 以及本地运行大模型

Dify 是 LLM 应用开发平台,不完全是可视化界面,可以快速构建 LLM 应用(RAG、AI 代理等),提供 API,可用于应用集成,支持 MongoDB、PostgreSQL 存储 LLM 相关数据, AI SaaS、应用开发,需要构建智能客服、RAG 应用等,类似的工具也有 AnythingLLM 可根据用户偏好进行选择使用

4.1 Open-WebUI
Open-WebUI官方地址:https://github.com/open-webui/open-webui

根据官网文档可使用pip和docker进行安装,我这里避免影响本地环境使用 docker进行安装

docker run -d -p 3000:8080 --add-host=host.docker.internal:host-gateway -v open-webui:/app/backend/data --name open-webui --restart always ghcr.io/open-webui/open-webui:main``   

访问 http://localhost:3000/

创建账号

访问成功

简单的问下问题,实际运行8b模型给出的代码是有问题的,根据报错的问题再次思考时间会变长

ps: 如果是离线或者网络不通的情况下不要开启设置中的 OpenAI API选项,不然后导致报错页面无法访问

4.2 Dify

Dify官方地址:https://github.com/langgenius/dify

启动成功,localhost 访问

登录成功选择 Ollama 进行添加模型模型供应商,如果 Ollama 和 Dify 是同机部署,并且 Dify 是通过 Docker 部署,那么填 http://host.docker.internal:11434 即可

接下来创建应用使用之前安装好的 DeepSeek R1 模型

可以看到右上角已经使用 deepseek-r1:8b 的模型了

简单的问个问题可以看到已经正常使用

Dify 不只是对话,其他功能可以自行探索下,后续有使用我也会更新。

DeepSeek 的使用
最后在本地部署蒸馏版的体验中对于回答的代码内容有些不尽人意,不过文字以及思考过程的能力还是可以的

如果想在后续体验完整版的 Deepseek,还没有高性能的硬件,那么直接使用 deepseek 官方的服务吧,api是真心不贵。

在 vscode 中通过 Continue 插件使用 Deepseek 的 API,也可以在 Open-WebUI 接入 API。


http://www.ppmy.cn/devtools/164721.html

相关文章

Geotools中获取Shapefile的属性表格字符集编码的一种方法

目录 前言 1、字符集编码的重要性 2、Geotools 在 GIS 开发中的地位 一、GeoTools的字符集知识 1、字符集的作用 2、shapefile中字符集信息 二、GeoTools中获取字符集的方法 1、默认获取 2、从DataStore中获取 3、从CPG文件中获取 4、生产字符获取实践 三、总结 前言…

『Python底层原理』--Python字典的实现机制

在Python中,字典(dict)是一种极为强大且常用的内置数据结构,它以键值对的形式存储数据,并提供了高效的查找、插入和删除操作。 接下来,我们将深入探究 Python 字典背后的实现机制,特别是其与哈…

无人机高功率快速充电器技术详解

无人机高功率快速充电器技术是无人机领域的一项重要技术,它直接关系到无人机的续航能力和作业效率。以下是对无人机高功率快速充电器技术的详细解析: 一、技术原理 无人机高功率快速充电器的基本技术原理涉及电能转换与控制。它将市电或直流电源转换为…

Spring学习笔记04:spring mvc和Spring Boot之间是什么关系?

Spring MVC 是什么? 想象你开了一家餐厅,顾客(用户)点菜、服务员传话、厨师做菜、最后服务员上菜。Spring MVC 就是规定这套流程的“餐厅管理规则”,专门用于处理网页请求(HTTP)和响应。 核心…

Mayavi一个强大的python库

Mayavi 介绍 Mayavi 是一个用于 Python 的科学数据可视化库,提供了一种便捷的方式来创建复杂的 3D 可视化效果。它基于 VTK(Visualization Toolkit)构建,能够处理各种类型的数据,包括标量、矢量和张量数据,广泛应用于科学研究和数据分析领域。 主要特点 丰富的可视化选…

OCR PDF 文件是什么?它包含什么内容?

有些 PDF 文件是通过扫描纸质书页生成的,这类文件有其独特的特点。有时,原始书籍是唯一可用的版本,因此只能通过扫描的方式获取内容。 如何识别 OCR PDF 文件? 你通常可以从外观上辨别 OCR PDF 文件——页面上的文本看起来像“锯…

代码随想录|哈希表|09四数之和

leetcode:18. 四数之和 - 力扣(LeetCode) 题目 题意:给定一个包含 n 个整数的数组 nums 和一个目标值 target,判断 nums 中是否存在四个元素 a,b,c 和 d ,使得 a b c d 的值与 target 相等…

什么是RPC,和HTTP有什么区别?

RPC是Remote ProcedureCall的缩写,译为远程过程调用。要想实现RPC通常需要包含传输协议和席列化协议的实现。 而我们熟知的HTTP,他的中文名叫超文本传输协议,所以他就是一种传输协议。所以,我们可以认为RPC和HTTP并不是同一个维度…