本地部署 DeepSeek R1 的几种常见方法

ops/2025/3/14 8:26:37/
aidu_pl">

本地部署 DeepSeek R1 的几种常见方法

      • 使用 Ollama 部署
      • 使用量化模型部署
      • 使用 Docker 部署(推荐)
      • 硬件与性能要求
      • 其他工具

使用 Ollama 部署

  1. 安装 Ollama:访问 Ollama 官网,根据系统类型下载并安装。
  2. 启动 Ollama:安装完成后,在开始菜单中找到 Ollama 图标启动。
  3. 下载并运行模型
    • 打开命令行工具(如 CMD 或 PowerShell)。
    • 输入命令 ollama run deepseek-r1:{model_size},其中 {model_size} 可根据硬件配置选择,如 8b14b32b
    • 如果是首次运行,Ollama 会自动下载模型文件。
  4. 测试模型:下载完成后,输入问题(如“介绍一下你自己”)与模型进行对话。
  5. ollama命令
    与模型对话:
    ollama run deepseek-r1:1.5b
    ollama run deepseek-r1:8b查看已安装的模型:
    ollama list删除模型:
    ollama rm deepseek-r1:1.5b
    

使用量化模型部署

  1. 下载量化模型
    • 选择合适的量化版本(如 Q4_K_M),可从社区提供的链接下载。
    • 例如,使用 git clonegit lfs pull 命令下载 Q4_K_M 版本。
  2. 加载模型
    • 使用工具如 llama-cli,指定模型文件路径并启用交互模式。
    • 示例命令:build/bin/llama-cli -m /tmp/DeepSeek-R1-Q4_K_M/DeepSeek-R1-Q4_K_M-00001-of-00009.gguf -i

使用 Docker 部署(推荐)

  1. 安装 Docker:确保系统已安装 Docker。
  2. 拉取模型镜像
    • 使用命令 docker pull {model_image},其中 {model_image} 是 DeepSeek R1 的镜像地址。
  3. 运行容器
    • 使用命令 docker run -it --rm {model_image} 启动容器。
    • 根据需要配置映射端口和挂载卷。

硬件与性能要求

  • 硬件配置:根据模型大小和量化方式,硬件需求有所不同。
    • 8B 版本:RTX 3060 8G 显卡、16G 内存。
    • 32B 版本:建议使用 RTX 4090 或更高配置。
  • 性能优化:可参考 DeepSeek 官方文档中的优化选项。

其他工具

  • 可结合 ChatBox 等工具,提升交互体验。
  • 使用 Open WebUI 图形界面查看后台运行情况。

如果需要更详细的信息,可以参考 DeepSeek 官方部署文档。


http://www.ppmy.cn/ops/165617.html

相关文章

stm32中分析UART中IDLE,RXNE,TC,TXE这些标志位的作用

下面将基于 STM32 标准库,结合之前提到的不同应用场景,给出使用 TXE、TC、IDLE 和 RXNE 标志位的代码示例及分析。 1. 连续数据发送(使用 TXE) 应用场景 向外部设备连续发送大量数据,如向显示屏发送显示数据、向传感…

Selenium Manager和webdriver manager的区别与联系

一、引言 1.1 自动化测试的重要性 在现代软件开发流程中,自动化测试已经成为保证软件质量和提高交付效率的关键实践。随着软件开发周期的缩短和软件复杂性的增加,手工测试已无法满足快速迭代的需求。自动化测试能够快速、准确地执行重复性测试任务&…

MS-DOS 6.22 下建立 FTP 服务器

在 MS-DOS 6.22 下建立 FTP 服务器需要使用第三方软件。以下是一个基本的步骤指南: 1. 下载并安装 mTCP 套件 mTCP 是一个适用于 MS-DOS 的网络工具包,其中包含一个 FTP 服务器程序。你可以从 mTCP 官方网站 下载该工具包。 2. 配置网络 确保你的 MS…

UI 设计中,如何找到视觉与功能的完美平衡点?

在 UI 设计的复杂世界里,视觉与功能宛如天平的两端,需精准把控才能实现完美平衡。一个成功的 UI 设计,既要凭借迷人的视觉效果吸引用户目光,又要以强大实用的功能满足用户需求,为用户带来高效、愉悦的使用体验。那么&a…

【从零开始学习计算机科学】数据库系统(六)DBMS事务管理

【从零开始学习计算机科学】数据库系统(六)DBMS事务管理 DBMS事务管理事务概念事务的特性事务的状态事务的调度事务的隔离SQL的四种隔离级别DBMS事务管理 事务概念 事务是构成单一逻辑工作单元的操作集合。事务是访问并可能更新各种数据项的一个程序执行单元。DBMS通过保证…

基于Python的selenium入门超详细教程(第1章)--WebDriver API篇

学习路线 自动化测试介绍及学习路线-CSDN博客 ​自动化测试之Web自动化(基于pythonselenium)-CSDN博客 参照博文:selenium入门超详细教程——网页自动化操作-CSDN博客 目录 前言 一、WebDriver API介绍 1.1 什么是WebDriver? 1.2 工…

蓝桥杯刷题 Day1 高精度加法

蓝桥杯刷题 Day1 提示:写完文章后,目录可以自动生成,如何生成可参考右边的帮助文档 文章目录 蓝桥杯刷题 Day1前言一、大数加法1. 解题思路2. 代码2.1主函数2.2 去除前导02.3 大数相加2.4 完整代码 二、KMP字符串匹配0. 知识点速记1. 解题思路…

RocketMQ常见问题总结

消息队列扫盲 消息队列顾名思义就是存放消息的队列,队列我就不解释了,别告诉我你连队列都不知道是啥吧? 所以问题并不是消息队列是什么,而是 消息队列为什么会出现?消息队列能用来干什么?用它来干这些事会…