全流程安装DeepSeek开源模型

server/2025/2/6 11:02:12/

目录

  • 配置要求
  • 安装Ollama
  • 选择大模型
  • 安装大模型
  • 对话
  • 备注

配置要求

我的电脑配置为:

CPU:i7 12代
GPU:3080
内存:32g
磁盘:1T

以上配置运行情况:

运行ollama run deepseek-r1:7b模型无压力,CPU/GPU使用率在 10% 左右。
运行ollama run deepseek-r1:32b模型输出明显变慢,大概 1 秒 2 ~4个 Token,CPU/GPU使用率在 70% 左右。

ChatGpt给出的部署推荐配置如下:

1. DeepSeek-R1 系列(轻量级部署)

适用于个人开发者、小型研究团队或资源有限的服务器。

模型版本参数量显存需求推荐配置
DeepSeek-R1-1.5B1.5B8GB+RTX 3060 (12GB) / RTX 4060 Ti (16GB)
DeepSeek-R1-7B7B24GB+RTX 3090 / 4090 (24GB) / A6000 (48GB)
DeepSeek-R1-14B14B40GB+RTX 4090 (24GB, 量化后可跑) / A100 (40GB)
DeepSeek-R1-32B32B80GB+A100 80GB / H100 (80GB)
DeepSeek-R1-70B70B128GB+2×A100 80GB (或更大GPU集群)

建议:

  • 7B及以下的模型可以在高端消费级显卡上运行(如4090),但需要使用 4-bit/8-bit 量化 降低显存占用(可用
    bitsandbytes)。
  • 14B以上的模型推荐使用 专业级显卡(A100, H100),或者 多卡并行 方案。

2. DeepSeek-V3 系列(高性能部署)

适用于企业、学术机构或大规模推理应用。

模型版本参数量显存需求推荐配置
DeepSeek-V3 (37B 激活参数)37B128GB+A100 80GB ×2 / H100 80GB
DeepSeek-V3 (671B 总参数)671B1.5TB+H100 80GB ×16+ (或更大GPU集群)

建议:

  • DeepSeek-V3 37B 可以在多张 A100 80GB 上运行(如 2×A100 80GB),建议采用 TPU 或多卡并行(FSDP, ZeRO) 进行优化。
  • DeepSeek-V3 671B 需要 云端或超算集群,适用于 数据中心 或 高端AI研究实验室。

实测 3080的 gpu也可以运行 32b模型,只是输出会慢一些,大概 1 秒 2 ~4个 Token。

安装Ollama

安装DeepSeek首先需要安装一个Ollama,这个软件相当于运行DeepSeek模型的底层,没有这个底层就没办法跑DeepSeek AI模型。

下载地址:

https://ollama.com/

点击下载windows版本:

在这里插入图片描述

点击Install

在这里插入图片描述
默认在c盘,不能修改,需要5G的磁盘大小。

安装好了以后在开始菜单可以查看有没有Ollama应用
在这里插入图片描述

选择大模型

直接命令安装:

DeepSeek提供的模型如下

版本:1.5b,适用于一般文字编辑使用(需要1.1GB空余空间)
ollama run deepseek-r1:1.5b版本:7b,DeepSeek的第一代推理模型,性能与OpenAl-01相当,包括从基于Llama和Qwen的DeepSeek-R1中提取的六个密集模型(需要
4.7GB空余空间)
ollama run deepseek-r1:7b版本:8b,(需要4.9GB空余空间)
ollama run deepseek-r1:8b版本:14b,(需要9GB空余空间)
ollama run deepseek-r1:14b版本:32b,(需要20GB空余空间)
ollama run deepseek-r1:32b版本:70b,(需要43GB空余空间)
ollama run deepseek-r1:70b版本:671b,(需要404GB空余空间)
ollama run deepseek-r1:671b

官网选择模型:

打开地址:

https://ollama.com/search

选择Models

在这里插入图片描述

选择deepseek-r1模型,左侧选择模型参数,右侧复制安装命令

在这里插入图片描述

安装大模型

打开终端,如果选择复制7b版本,可以复制如下命令:

ollama run deepseek-r1:7b

在终端内执行

在这里插入图片描述

等待下载完成

在这里插入图片描述

下载结束之后就有一小会儿出现【verifying sha256 digest】,是在检查完整性之类的东西,请耐心等待(模型越大等待时间越长)

在这里插入图片描述
成功之后会提示success

对话

安装成功后会可以直接输入问题按回车提问。

在这里插入图片描述
当然,终端的展示效果还是不太好,这时候就需要安装一下openWebUi,需要docker环境,如果没有安装docker的安装一个docker。

终端执行以下命令:

docker run -d -p 3000:8080 --add-host=host.docker.internal:host-gateway -v open-webui:/app/backend/data --name open-webui --restart always ghcr.io/open-webui/open-webui:main

在这里插入图片描述

等待docker启动成功

在这里插入图片描述

安装完成后通过如下地址访问openWebUi:

http://localhost:3000 

在这里插入图片描述

第一次进入需要设置一下管理员的账号密码。
在这里插入图片描述
随后进入主页,左侧会展示当前我们运行的模型。然后你就可以尽情的问他了。
在这里插入图片描述

备注

查看当前本地ollama有的模型命令:

ollama list

在这里插入图片描述
运行已有模型命令:

ollama run 模型名称

示例:

>ollama run deepseek-r1:7b

在这里插入图片描述

可供下载的模型:

版本:1.5b,适用于一般文字编辑使用(需要1.1GB空余空间)
ollama run deepseek-r1:1.5b版本:7b,DeepSeek的第一代推理模型,性能与OpenAl-01相当,包括从基于Llama和Qwen的DeepSeek-R1中提取的六个密集模型(需要
4.7GB空余空间)
ollama run deepseek-r1:7b版本:8b,(需要4.9GB空余空间)
ollama run deepseek-r1:8b版本:14b,(需要9GB空余空间)
ollama run deepseek-r1:14b版本:32b,(需要20GB空余空间)
ollama run deepseek-r1:32b版本:70b,(需要43GB空余空间)
ollama run deepseek-r1:70b版本:671b,(需要404GB空余空间)
ollama run deepseek-r1:671b

http://www.ppmy.cn/server/165394.html

相关文章

基于单片机的智能家居设计(论文+源码)

2.1需求分析 本次基于STM32的蓝牙智能家居,在功能上如下: 1.可以实现家居环境温湿度,烟雾浓度的检测。 2.可以将检测到的温湿度,烟雾浓度等信息通过蓝色传输到手机APP; 3.用户可以打开或者关闭风扇,以便…

Aosp 15 编译遇到问题排查

最近想编译aosp 15 的系统。特意从谷歌下载一份 <remote name"aosp"fetch".."review"https://android-review.googlesource.com/" /><default revision"refs/tags/android-15.0.0_r11"remote"aosp"sync-j"4…

MongoDB快速上手(包会用)

MongoDB快速上手&#xff08;包会用&#xff09; MongoDB 介绍 &#x1f431;‍&#x1f4bb; MongoDB 是一个开源的 文档型数据库&#xff0c;它使用类似 JSON 的 BSON&#xff08;二进制 JSON&#xff09;格式来存储数据&#xff0c;具有高性能、可扩展性和灵活性。它适用于…

20250204在Ubuntu22.04下配置荣品的RK3566开发板的Android13的编译环境

20250204在Ubuntu22.04下配置荣品的RK3566开发板的Android13的编译环境 2025/2/4 12:38 缘起&#xff1a;公司本来要采用荣品RK3588S核心板的&#xff0c;但是最终因为价格的原因使用了RK3566核心板。 https://doc.rpdzkj.cn/#/navbar/%E7%BD%91%E7%9B%98%E9%93%BE%E6%8E%A5?…

【数据结构】_复杂度

目录 1. 算法效率 2. 时间复杂度 2.1 时间复杂度概念 2.2 准确的时间复杂度函数式 2.3 大O渐进表示法 2.4 时间复杂度的常见量级 2.5 时间复杂度示例 3. 空间复杂度 3.1 空间复杂度概念 3.2 空间复杂度示例 1. 算法效率 一般情况下&#xff0c;衡量一个算法的好坏是…

【OpenCV实战】基于 OpenCV 的多尺度与模板匹配目标跟踪设计与实现

文章目录 基于 OpenCV 的模板匹配目标跟踪设计与实现1. 摘要2. 系统概述3. 系统原理3.1 模板匹配的基本原理3.2 多尺度匹配 4. 逻辑流程4.1 系统初始化4.2 主循环4.3 逻辑流程图 5. 关键代码解析5.1 鼠标回调函数5.2 多尺度模板匹配 6. 系统优势与不足6.1 优势6.2 不足 7. 总结…

使用1panel给neo4j容器安装apoc插件

文章目录 下载apoc插件安装apoc插件重启容器并验证 APOC插件是 Awesome Procedures of Cypher 是Neo4j图数据库的扩展过程和函数库。 下载apoc插件 apoc插件下载界面&#xff0c;选择与neo4j兼容的apoc版本apoc与neo4j版本对应表 安装apoc插件 需要挂载容器中/var/lib/ne…

2025游戏行业的趋势预测

一、市场现状 从总产值的角度来看&#xff0c;游戏总产值的增长率已经放缓&#xff0c;由增量市场转化为存量市场&#xff0c;整体的竞争强度将会加大&#xff0c;技术水平不强&#xff08;开发技术弱、产品品质低、开发效率低&#xff09;的公司将会面临更大的生存的困难。 从…