使用服务器部署DeepSeek-R1模型【详细版】

ops/2025/2/9 13:28:58/

文章目录

  • 引言
  • deepseek-r1
  • IDE或者终端工具
  • 算力平台
  • 体验deepseek-r1模型
  • 总结

引言

在现代的机器学习和深度学习应用中,模型部署和服务化是每个开发者面临的重要任务。无论是用于智能推荐、自然语言处理还是图像识别,如何高效、稳定地将深度学习模型部署到生产环境中,都是提升系统性能和用户体验的关键环节。在本文中,我们将详细介绍如何在服务器上成功部署DeepSeek-R1模型,帮助你一步步了解从环境搭建到模型上线的全过程。

deepseek-r1

最近热度十分高的DeepSeek-R1大家相比都听过,它是幻方量化旗下大模型公司 DeepSeek 研发的系列推理模型,于 2025 年 1 月 20 日正式发布并开源权重。它使用强化学习训练,推理时包含大量反思和验证,思维链长,在数学、代码、自然语言推理等复杂任务上表现出色,与 ==OpenAI o1 ==性能相当 ,在 AIME、MATH-500、SWE-Bench Verified 等基准测试中成绩优异,还能自我事实核查降低错误风险。模型参数达 6710 亿,也有 15 亿至 70 亿参数的蒸馏版本,最小版可在普通笔记本运行。
目前,DeepSeek-R1 已在多个平台接入部署,如数码视讯、天翼云、联通云、青云科技基石智算 CoresHub 等

在这里插入图片描述
下图是模型出处
https://www.modelscope.cn/models/deepseek-ai/DeepSeek-R1/summary
在这里插入图片描述

IDE或者终端工具

这里我们选择IDE(VScode或Pycharm)或者终端工具,都可以,这里我选择使用Pycharm,当然别的也行,这里可以自行选择

算力平台

算力平台,我这里选择蓝耕云智算

在这里插入图片描述
我们选择一个3090的显卡试试水
在这里插入图片描述

体验deepseek-r1模型

在体验之前,我们需要下载必要的文件,这里我给大家一个网址
https://github.com/1692775560/deepseek_project

在这里插入图片描述
我们只需要将其放到服务器上面,就可以完成体验了

根据我们之前下载好的IDE,我们现在连接一下,然后就可以开心愉快的使用喽~下面的具体的链接过程

第一步
复制账户密码
在这里插入图片描述

第二步
粘贴下图所示的位置,进行连接等待本地文件传输到服务器
在这里插入图片描述
备注:username填写root即可,host,填写@后面的即可
在这里插入图片描述
这样就是成功了,当然我们还有配置一下环境,这里参考我下面的三小步即可

在这里插入图片描述

第三步

接下来,我们只需要在终端输入代码进行体验,但是进入我们要记得进入那个文件夹里面哦,下图是进入终端的方法

在这里插入图片描述

在进入到对应文件夹内,我们记得下载库啊,pip install -r requirements.txt
下载完之后,运行python run_model.py即可
在这里插入图片描述

总结

大模型发展速度是真的很快,过去可能国外更加领先一点,但是如今我国的deepseek-r1模型甚至可以挤进了世界前三,对于我们大部分人来说,自己构建一个大模型可能需要庞大的算力,数据等等,但是若我们学会如何使用,如何部署那么对我们日常工作学习也是起到了一个 促进作用,希望我的视频对你有帮助~~~

文末附上服务器的注册地址https://cloud.lanyun.net//#/registerPage?promoterCode=0131


http://www.ppmy.cn/ops/156982.html

相关文章

21.2.7 综合示例

版权声明:本文为博主原创文章,转载请在显著位置标明本文出处以及作者网名,未经作者允许不得用于商业目的。 【例 21.7】【项目:code21-007】填充职员表并打印。 本例使用到的Excel文件为:职员信息登记表.xlsx&#x…

鸿蒙接入支付宝SDK后模拟器无法运行,报错error: install parse native so failed.

鸿蒙项目接入支付宝后,运行提示error: install parse native so failed. 该问题可能由于设备支持的 Abi 类型与 C 工程中的不匹配导致. 官网error: install parse native so failed.错误解决办法 根据官网提示在模块build-profile.json5中添加“x86_64”依然报错 问…

回退 android studio emulator 的版本

前情提要 最近用 frida 需要一个完全跑 arm64 的手机 os,因为雷电实时转义 arm 到 x64 的方案本质上还是 x64,会导致 frida 有 bug。查了一下有帖子说 android studio 自带的模拟器支持直接跑 arm64 的镜像 (Other Images) 直接跑跑不通,调…

使用 Apache Spark 进行大数据分析

使用 Apache Spark 进行大数据分析 环境准备 为了能够在本地环境中运行Spark程序,需要先完成环境搭建。确保已经安装了Jupyter Notebook和Apache Spark,并完成了两者之间的集成。 创建 SparkSession 在 Python 中使用 PySpark 时,通常会创…

【自开发工具介绍】SQLSERVER的ImpDp和ExpDp工具演示05

SQLSERVER的ImpDp和ExpDp工具演示 1、表部分数据导出 (-query) ※「-query」和「-include_table」必须一起使用 「-query」后面字符串是sql文的where语句,但要注意要使用%,需要写%% 验证用:导出的表,导入到新的数据库 db的数…

4.Python字符串和列表:字符串输入、字符串输出、下标和切片、字符串常见函数、列表(list)、列表的循环遍历、列表的增删改查、列表的嵌套、列表的切片

1. Python 字符串 1.1 字符串输入 input() 函数用于从用户获取字符串输入。它总是返回一个字符串类型的值。 # 从用户输入字符串 name input("请输入你的名字:") print(f"你好, {name}")1.2 字符串输出 字符串的输出通常使用 print() 函数…

从结构体成员指针反推结构体地址:rt_container_of 宏解析

文章目录 rt_container_of 宏概述步骤1:计算成员偏移量步骤2:将成员指针转换为字节指针步骤3:计算结构体的地址步骤4:返回结构体指针 代码示例宏的内部实现解析 rt_container_of 宏概述 rt_container_of 宏是一个非常实用的宏定义…

web3D交互展示是什么?应用场景有哪些?

Web3D交互展示是利用Web3D技术,在网页上实现3D产品的全方位交互展示。用户可自由旋转、缩放及移动产品视角,从而深入了解产品的每一处细节与尺寸信息。以下是关于Web3D交互展示的详细解释: 一、定义与原理 定义:Web3D交互展示是…