使用服务器部署DeepSeek-R1模型【详细版】

embedded/2025/2/12 10:22:13/

文章目录

  • 引言
  • deepseek-r1
  • IDE或者终端工具
  • 算力平台
  • 体验deepseek-r1模型
  • 总结

引言

在现代的机器学习和深度学习应用中,模型部署和服务化是每个开发者面临的重要任务。无论是用于智能推荐、自然语言处理还是图像识别,如何高效、稳定地将深度学习模型部署到生产环境中,都是提升系统性能和用户体验的关键环节。在本文中,我们将详细介绍如何在服务器上成功部署DeepSeek-R1模型,帮助你一步步了解从环境搭建到模型上线的全过程。

deepseek-r1

最近热度十分高的DeepSeek-R1大家相比都听过,它是幻方量化旗下大模型公司 DeepSeek 研发的系列推理模型,于 2025 年 1 月 20 日正式发布并开源权重。它使用强化学习训练,推理时包含大量反思和验证,思维链长,在数学、代码、自然语言推理等复杂任务上表现出色,与 ==OpenAI o1 ==性能相当 ,在 AIME、MATH-500、SWE-Bench Verified 等基准测试中成绩优异,还能自我事实核查降低错误风险。模型参数达 6710 亿,也有 15 亿至 70 亿参数的蒸馏版本,最小版可在普通笔记本运行。
目前,DeepSeek-R1 已在多个平台接入部署,如数码视讯、天翼云、联通云、青云科技基石智算 CoresHub 等

在这里插入图片描述
下图是模型出处
https://www.modelscope.cn/models/deepseek-ai/DeepSeek-R1/summary
在这里插入图片描述

IDE或者终端工具

这里我们选择IDE(VScode或Pycharm)或者终端工具,都可以,这里我选择使用Pycharm,当然别的也行,这里可以自行选择

算力平台

算力平台,我这里选择蓝耕云智算

在这里插入图片描述
我们选择一个3090的显卡试试水
在这里插入图片描述

体验deepseek-r1模型

在体验之前,我们需要下载必要的文件,这里我给大家一个网址
https://github.com/1692775560/deepseek_project

在这里插入图片描述
我们只需要将其放到服务器上面,就可以完成体验了

根据我们之前下载好的IDE,我们现在连接一下,然后就可以开心愉快的使用喽~下面的具体的链接过程

第一步
复制账户密码
在这里插入图片描述

第二步
粘贴下图所示的位置,进行连接等待本地文件传输到服务器
在这里插入图片描述
备注:username填写root即可,host,填写@后面的即可
在这里插入图片描述
这样就是成功了,当然我们还有配置一下环境,这里参考我下面的三小步即可

在这里插入图片描述

第三步

接下来,我们只需要在终端输入代码进行体验,但是进入我们要记得进入那个文件夹里面哦,下图是进入终端的方法

在这里插入图片描述

在进入到对应文件夹内,我们记得下载库啊,pip install -r requirements.txt
下载完之后,运行python run_model.py即可
在这里插入图片描述

总结

大模型发展速度是真的很快,过去可能国外更加领先一点,但是如今我国的deepseek-r1模型甚至可以挤进了世界前三,对于我们大部分人来说,自己构建一个大模型可能需要庞大的算力,数据等等,但是若我们学会如何使用,如何部署那么对我们日常工作学习也是起到了一个 促进作用,希望我的视频对你有帮助~~~

文末附上服务器的注册地址https://cloud.lanyun.net//#/registerPage?promoterCode=0131


http://www.ppmy.cn/embedded/161569.html

相关文章

【R语言】获取数据

R语言自带2种数据存储格式:*.RData和*.rds。 这两者的区别是:前者既可以存储数据,也可以存储当前工作空间中的所有变量,属于非标准化存储;后者仅用于存储单个R对象,且存储时可以创建标准化档案&#xff0c…

【含文档+PPT+源码】基于微信小程序的社交摄影约拍平台的设计与实现

项目介绍 本课程演示的是一款基于微信小程序的社交摄影约拍平台的设计与实现,主要针对计算机相关专业的正在做毕设的学生与需要项目实战练习的 Java 学习者。 1.包含:项目源码、项目文档、数据库脚本、软件工具等所有资料 2.带你从零开始部署运行本套系…

微信小程序登陆鉴权最佳实现

文章目录 一、使用步骤1.创建鉴权组件auth2.app.json中注册全局组件3.页面使用组件4. 读取本地存储的 token 数据,用于判断是否曾登录过5. 检测登录状态,要求未登录时不显示页面中的内容且跳转到登录页面 一、使用步骤 1.创建鉴权组件auth 2.app.json中…

接口测试Day12-持续集成、git简介和安装、Gitee远程仓库、jenkins集成

持续集成 概念: 团队成员将自己的工作成果,持续集成到一个公共平台的过程。成员可以每天集成一次,也可以一天集成多 次。 相关工具: 本地代码管理:git远程代码管理:gitee(国内)、github(国外)、gitlib(公司…

【神经网络框架】非局部神经网络

一、非局部操作的数学定义与理论框架 1.1 非局部操作的通用公式 非局部操作(Non-local Operation)是该研究的核心创新点,其数学定义源自经典计算机视觉中的非局部均值算法(Non-local Means)。在深度神经网络中,非局部操作被形式化为: 其中: 1.2 与传统操作的对比分析…

2025年前端面试,性能相关的面试题汇总

以下是一些与前端性能相关的面试题汇总,适合准备 2025 年的前端面试: 1. 性能优化基础 什么是页面加载性能? 解释页面加载性能的概念,包括首屏加载时间、内容交互时间等。 如何评估网页性能? 介绍使用 Chrome DevTools、Lighthouse、WebPageTest 等工具进行性能评估的方法…

从零开始设计一个完整的网站:HTML、CSS、PHP、MySQL 和 JavaScript 实战教程

前言 本文将从实战角度出发,带你一步步设计一个完整的网站。我们将从 静态网页 开始,然后加入 动态功能(使用 PHP),连接 数据库,最后加入 JavaScript 实现交互功能。通过这个教程,你将掌握一个…

如何将本地 Node.js 服务部署到宝塔面板:完整的部署指南

文章简介: 将本地开发的 Node.js 项目部署到线上服务器是开发者常见的工作流程之一。在这篇文章中,我将详细介绍如何将本地的 Node.js 服务通过宝塔面板(BT 面板)上线。宝塔面板是一个强大的服务器管理工具,具有简洁的…