【AI】DeepSeek来了!!!

news/2025/2/7 18:02:23/

目录

DeepSeek%E7%AE%80%E4%BB%8B-toc" name="tableOfContents" style="margin-left:0px">1 DeepSeek简介

DeepSeek%20V3%20%E6%A8%A1%E5%9E%8B%EF%BC%9F-toc" name="tableOfContents" style="margin-left:0px">2 如何在本地环境中部署和运行 DeepSeek V3 模型?

■ 基本要求

■ 代码和模型

▲ 克隆仓库并安装依赖

▲ 下载模型权重

▲ 部署方案



DeepSeek%E7%AE%80%E4%BB%8B" name="1%20DeepSeek%E7%AE%80%E4%BB%8B" style="text-align:left">1 DeepSeek简介

DeepSeek 在国产 AI 领域是一股清流。它专注于技术研发,以卓越的模型性能赢得了用户的认可。DeepSeek V3 的发布,更是展现了 DeepSeek 在 AI 领域的领先地位

DeepSeek官网: DeepSeek

DeepSeek开发者平台: DeepSeek

DeepSeek V3 GitHub 仓库: GitHub - deepseek-ai/DeepSeek-V3

DeepSeek V3 Hugging Face 链接: https://huggingface.co/deepseek-ai/DeepSeek-V3-Base

Deepseek-deploy-guideDeepSeek V3 本地部署指南:从入门到精通

DeepSeek%20V3%20%E6%A8%A1%E5%9E%8B%EF%BC%9F" name="2%20%E5%A6%82%E4%BD%95%E5%9C%A8%E6%9C%AC%E5%9C%B0%E7%8E%AF%E5%A2%83%E4%B8%AD%E9%83%A8%E7%BD%B2%E5%92%8C%E8%BF%90%E8%A1%8C%20DeepSeek%20V3%20%E6%A8%A1%E5%9E%8B%EF%BC%9F" style="text-align:left">2 如何在本地环境中部署和运行 DeepSeek V3 模型

■ 基本要求

NVIDIA GPU(推荐A100或H100)或AMD GPU

充足的系统内存(推荐32GB以上)

Linux 操作系统(推荐Ubuntu 20.04或更高版本)

Python 3.8 或更高版本

■ 代码和模型

 克隆仓库并安装依赖

git clone https://github.com/deepseek-ai/DeepSeek-V3.gitcd DeepSeek-V3/inferencepip install -r requirements.txt

▲ 下载模型权重

HuggingFace下载模型权重,并将其放入指定的文件夹。

DeepSeek-V3提供了两种模型版本:

① 基础模型:适用于通用任务。

② 对话模型:针对对话和交互优化。

具体步骤如下:

① 安装Git LFS

对于 Debian 或 Ubuntu 系统,可以使用以下命令安装Git LFS 

sudo apt-get install git-lfs

② 初始化 Git LFS

初始化 Git LFS在本地仓库中运行git lfs install命令,确保Git LFS的钩子被正确设置在Git配置中。

git lfs install

③ 下载模型权重

# For Base Modelgit clone https://huggingface.co/deepseek-ai/DeepSeek-V3-Base# For Chat Modelgit clone https://huggingface.co/deepseek-ai/DeepSeek-V3

▲ 部署方案

基础的方式—快速测试和实验。

将FP8权重转换为16权重,可以使用以下命令:

python convert.py --hf-ckpt-path /path/to/DeepSeek-V3 --save-path /path/to/DeepSeek-V3-Demo --n-experts 256 --model-parallel 16

使用DeepSeek-Infer Demo进行推理。推理示例:

torchrun --nnodes 2 --nproc-per-node 8 generate.py --node-rank $RANK --master-addr $ADDR --ckpt-path /path/to/DeepSeek-V3-Demo --config configs/config_671B.json --interactive --temperature 0.7 --max-new-tokens 200

说明:本文内容来源于网络,如有侵权,请联系作者删除。

至此,本文的内容就结束啦。


http://www.ppmy.cn/news/1570120.html

相关文章

Docker 部署 GLPI(IT 资产管理软件系统)

GLPI 简介 GLPI open source tool to manage Helpdesk and IT assets GLPI stands for Gestionnaire Libre de Parc Informatique(法语 资讯设备自由软件 的缩写) is a Free Asset and IT Management Software package, that provides ITIL Service De…

C# Action和 Func的用法

C#中的数据类型 函数数据类型 Action 是一个数据类型 但是是没有返回值得函数数据类型 Func 用于指定一个有返回值的委托 internal class Program{static void Main(string[] args){TT.F1(NoVoid);TT.F2(Void1);Void2(() > { Console.WriteLine("Void2执行了");…

Unity Shader Graph 2D - 使用DeepSeek协助绘制一个爱心

最近十分流行使用DeepSeek AI,于是想尝试着能不能用DeepSeek来帮助我实现一些Shader Graph效果,正好之前看到了爱心图形,就说干脆用DeepSeek来告诉我怎么使用Shader Graph来绘制一个爱心。 问DeepSeek怎么绘制爱心 首先打开DeepSeek的网站&a…

python学opencv|读取图像(五十四)使用cv2.blur()函数实现图像像素均值处理

【1】引言 前序学习进程中,对图像的操作均基于各个像素点上的BGR值不同而展开。 对于彩色图像,每个像素点上的BGR值为三个整数,因为是三通道图像;对于灰度图像,各个像素上的BGR值是一个整数,因为这是单通…

【机器学习与数据挖掘实战】案例11:基于灰色预测和SVR的企业所得税预测分析

【作者主页】Francek Chen 【专栏介绍】 ⌈ ⌈ ⌈机器学习与数据挖掘实战 ⌋ ⌋ ⌋ 机器学习是人工智能的一个分支,专注于让计算机系统通过数据学习和改进。它利用统计和计算方法,使模型能够从数据中自动提取特征并做出预测或决策。数据挖掘则是从大型数据集中发现模式、关联…

CSS outline详解:轮廓属性的详细介绍

什么是outline? outline(轮廓)是CSS中一个有趣的属性,它在元素边框(border)的外围绘制一条线。与border不同的是,outline不占用空间,不会影响元素的尺寸和位置。这个特性使它在某些…

MySQL三大日志——binlog、redoLog、undoLog详解

日志是mysql数据库的重要组成部分,记录着数据库运行期间各种状态信息,能帮助我们进行很多容错及分析工作,其中有三大日志与我们这些开发者息息相关,本文将介绍binlog、redoLog、undoLog三种日志: 1. redoLog 1.1 为什么…

DeepSeek 遭 DDoS 攻击背后:DDoS 攻击的 “千层套路” 与安全防御 “金钟罩”_deepseek ddos

当算力博弈升级为网络战争:拆解DDoS攻击背后的技术攻防战——从DeepSeek遇袭看全球网络安全新趋势 在数字化浪潮席卷全球的当下,网络已然成为人类社会运转的关键基础设施,深刻融入经济、生活、政务等各个领域。从金融交易的实时清算&#xf…