全流程安装DeepSeek开源模型

ops/2025/2/7 6:01:04/

目录

  • 配置要求
  • 安装Ollama
  • 选择大模型
  • 安装大模型
  • 对话
  • 备注

配置要求

我的电脑配置为:

CPU:i7 12代
GPU:3080
内存:32g
磁盘:1T

以上配置运行情况:

运行ollama run deepseek-r1:7b模型无压力,CPU/GPU使用率在 10% 左右。
运行ollama run deepseek-r1:32b模型输出明显变慢,大概 1 秒 2 ~4个 Token,CPU/GPU使用率在 70% 左右。

ChatGpt给出的部署推荐配置如下:

1. DeepSeek-R1 系列(轻量级部署)

适用于个人开发者、小型研究团队或资源有限的服务器。

模型版本参数量显存需求推荐配置
DeepSeek-R1-1.5B1.5B8GB+RTX 3060 (12GB) / RTX 4060 Ti (16GB)
DeepSeek-R1-7B7B24GB+RTX 3090 / 4090 (24GB) / A6000 (48GB)
DeepSeek-R1-14B14B40GB+RTX 4090 (24GB, 量化后可跑) / A100 (40GB)
DeepSeek-R1-32B32B80GB+A100 80GB / H100 (80GB)
DeepSeek-R1-70B70B128GB+2×A100 80GB (或更大GPU集群)

建议:

  • 7B及以下的模型可以在高端消费级显卡上运行(如4090),但需要使用 4-bit/8-bit 量化 降低显存占用(可用
    bitsandbytes)。
  • 14B以上的模型推荐使用 专业级显卡(A100, H100),或者 多卡并行 方案。

2. DeepSeek-V3 系列(高性能部署)

适用于企业、学术机构或大规模推理应用。

模型版本参数量显存需求推荐配置
DeepSeek-V3 (37B 激活参数)37B128GB+A100 80GB ×2 / H100 80GB
DeepSeek-V3 (671B 总参数)671B1.5TB+H100 80GB ×16+ (或更大GPU集群)

建议:

  • DeepSeek-V3 37B 可以在多张 A100 80GB 上运行(如 2×A100 80GB),建议采用 TPU 或多卡并行(FSDP, ZeRO) 进行优化。
  • DeepSeek-V3 671B 需要 云端或超算集群,适用于 数据中心 或 高端AI研究实验室。

实测 3080的 gpu也可以运行 32b模型,只是输出会慢一些,大概 1 秒 2 ~4个 Token。

安装Ollama

安装DeepSeek首先需要安装一个Ollama,这个软件相当于运行DeepSeek模型的底层,没有这个底层就没办法跑DeepSeek AI模型。

下载地址:

https://ollama.com/

点击下载windows版本:

在这里插入图片描述

点击Install

在这里插入图片描述
默认在c盘,不能修改,需要5G的磁盘大小。

安装好了以后在开始菜单可以查看有没有Ollama应用
在这里插入图片描述

选择大模型

直接命令安装:

DeepSeek提供的模型如下

版本:1.5b,适用于一般文字编辑使用(需要1.1GB空余空间)
ollama run deepseek-r1:1.5b版本:7b,DeepSeek的第一代推理模型,性能与OpenAl-01相当,包括从基于Llama和Qwen的DeepSeek-R1中提取的六个密集模型(需要
4.7GB空余空间)
ollama run deepseek-r1:7b版本:8b,(需要4.9GB空余空间)
ollama run deepseek-r1:8b版本:14b,(需要9GB空余空间)
ollama run deepseek-r1:14b版本:32b,(需要20GB空余空间)
ollama run deepseek-r1:32b版本:70b,(需要43GB空余空间)
ollama run deepseek-r1:70b版本:671b,(需要404GB空余空间)
ollama run deepseek-r1:671b

官网选择模型:

打开地址:

https://ollama.com/search

选择Models

在这里插入图片描述

选择deepseek-r1模型,左侧选择模型参数,右侧复制安装命令

在这里插入图片描述

安装大模型

打开终端,如果选择复制7b版本,可以复制如下命令:

ollama run deepseek-r1:7b

在终端内执行

在这里插入图片描述

等待下载完成

在这里插入图片描述

下载结束之后就有一小会儿出现【verifying sha256 digest】,是在检查完整性之类的东西,请耐心等待(模型越大等待时间越长)

在这里插入图片描述
成功之后会提示success

对话

安装成功后会可以直接输入问题按回车提问。

在这里插入图片描述
当然,终端的展示效果还是不太好,这时候就需要安装一下openWebUi,需要docker环境,如果没有安装docker的安装一个docker。

终端执行以下命令:

docker run -d -p 3000:8080 --add-host=host.docker.internal:host-gateway -v open-webui:/app/backend/data --name open-webui --restart always ghcr.io/open-webui/open-webui:main

在这里插入图片描述

等待docker启动成功

在这里插入图片描述

安装完成后通过如下地址访问openWebUi:

http://localhost:3000 

在这里插入图片描述

第一次进入需要设置一下管理员的账号密码。
在这里插入图片描述
随后进入主页,左侧会展示当前我们运行的模型。然后你就可以尽情的问他了。
在这里插入图片描述

备注

查看当前本地ollama有的模型命令:

ollama list

在这里插入图片描述
运行已有模型命令:

ollama run 模型名称

示例:

>ollama run deepseek-r1:7b

在这里插入图片描述

可供下载的模型:

版本:1.5b,适用于一般文字编辑使用(需要1.1GB空余空间)
ollama run deepseek-r1:1.5b版本:7b,DeepSeek的第一代推理模型,性能与OpenAl-01相当,包括从基于Llama和Qwen的DeepSeek-R1中提取的六个密集模型(需要
4.7GB空余空间)
ollama run deepseek-r1:7b版本:8b,(需要4.9GB空余空间)
ollama run deepseek-r1:8b版本:14b,(需要9GB空余空间)
ollama run deepseek-r1:14b版本:32b,(需要20GB空余空间)
ollama run deepseek-r1:32b版本:70b,(需要43GB空余空间)
ollama run deepseek-r1:70b版本:671b,(需要404GB空余空间)
ollama run deepseek-r1:671b

http://www.ppmy.cn/ops/156357.html

相关文章

4.回归与聚类算法 4.1线性回归

4.1.1 线性回归的原理 1 线性回归应用场景: 房价预测 销售额度预测 金融:贷款额度预测,利用线性回归以及系数分析因子 2 什么是线性回归 1) 定义:利用回归方程(函数)对一个或者多个自变量…

Linux 环境安装 Elasticsearch 8

参照 elastic 官方安装指南:https://www.elastic.co/guide/en/elasticsearch/reference/current/install-elasticsearch.html 安装步骤参照 https://www.elastic.co/guide/en/elasticsearch/reference/current/deb.html 按下面步骤依次执行命令: wget -…

C基础寒假练习(2)

一、输出3-100以内的完美数&#xff0c;(完美数&#xff1a;因子和(因子不包含自身)数本身 #include <stdio.h>// 函数声明 int isPerfectNumber(int num);int main() {printf("3-100以内的完美数有:\n");for (int i 3; i < 100; i){if (isPerfectNumber…

工厂方法模式(Java)

工厂方法模式&#xff08;Java&#xff09; 工厂方法模式概述 1. 工厂方法模式的定义 工厂方法模式提供了一种创建对象的方式&#xff0c;而无需指定具体的类。它通过定义一个接口来创建对象&#xff0c;具体的实例化过程由子类实现。这种方式使得代码更加灵活&#xff0c;易…

机器学习8-卷积和卷积核1

机器学习8-卷积和卷积核1 卷积与图像去噪卷积的定义与性质定义性质卷积的原理卷积步骤卷积的示例与应用卷积的优缺点优点缺点 总结 高斯卷积核卷积核尺寸的设置依据任务类型考虑数据特性实验与调优 高斯函数标准差的设置依据平滑需求结合卷积核尺寸实际应用场景 总结 图像噪声与…

蓝桥杯python基础算法(2-2)——基础算法(D)——进制转换*

目录 五、进制转换 十进制转任意进制&#xff0c;任意进制转十进制 例题 P1230 进制转换 作业 P2095 进制转化 作业 P2489 进制 五、进制转换 十进制转任意进制&#xff0c;任意进制转十进制 int_to_char "0123456789ABCDEF" def Ten_to_K(k, x):answer "…

神经网络|(七)概率论基础知识-贝叶斯公式

【1】引言 前序我们已经了解了一些基础知识。 古典概型&#xff1a;有限个元素参与抽样&#xff0c;每个元素被抽样的概率相等。 条件概率&#xff1a;在某条件已经达成的前提下&#xff0c;新事件发生的概率。实际计算的时候&#xff0c;应注意区分&#xff0c;如果是计算综…

第35章 星骗计划的阴影

清晨&#xff0c;阳光透过窗帘缝隙&#xff0c;轻柔地洒落在东方艾艾的办公桌上。他揉了揉惺忪的睡眼&#xff0c;昨晚加班至深夜的疲惫仍未消散。在航天锐创所&#xff0c;刚结束一轮紧张培训&#xff0c;他便马不停蹄地投身于 “星渊计划&#xff1a;航天智擎开发项目” 的筹…