国产超强开源大语言模型 DeepSeek-R1-70B 一键部署教程

devtools/2025/2/25 6:45:53/

DeepSeek-R1-Distill-Llama-70B 是深度求索 (DeepSeek) 公司于 2025 年推出的开源语言模型,参数规模高达 700 亿。它是基于 Llama3.3-70B-Instruct 进行训练的,采用强化学习和蒸馏技术提升推理表现,不仅继承了 Llama 系列模型的优势,还在此基础上进一步优化了推理能力,尤其在数学、代码与逻辑推理任务中表现突出。

作为 DeepSeek 系列的高性能版本,它在多个基准测试中表现出色。此外,该模型是 DeepSeek AI 提供的一款推理增强型模型,支持多种应用场景,如移动设备与边缘计算、在线推理服务等,以提高响应速度和降低运营成本,其具备非常强大的推理和决策能力。在高级 AI 助手、科研分析等领域,能够提供极其专业和深入的分析结果。例如在医学科研中,70B 版本可以对大量的医学数据进行分析,为疾病研究提供有价值的参考。

教程链接:https://go.openbayes.com/3L307

使用云平台:OpenBayes
http://openbayes.com/console/signup?r=sony_0m6v

登录 http://OpenBayes.com,在「公共教程」页面,选择「一键部署 DeepSeek-R1-70B」教程。

页面跳转后,点击右上角「克隆」,将该教程克隆至自己的容器中。

选择「NVIDIA RTX A6000」以及「PyTorch」镜像,OpenBayes 平台上线了新的计费方式,大家可以按照需求选择「按量付费」或「包日/周/月」,点击「继续执行」。可以使用文章开头的邀请链接,获得 RTX 4090 使用时长!

稍等片刻,待系统分配好资源,当状态变为「运行中」后,点击「API 地址」边上的跳转箭头,即可跳转至 Demo 页面。

进入模型后,在右侧可以设置对话参数。
常见对话设置

Temperature(温度)

  • 控制输出的随机性,范围一般在 0.0-2.0 之间。
  • 低值(如 0.1):更确定,偏向常见词汇。
  • 高值(如 1.5):更随机,可能生成更有创意但不稳定的内容。

Top-k Sampling(Top-k 采样)

  • 只从 概率最高的 k 个 词中采样,排除低概率词汇。
  • k 值小(如 10):更确定,减少偶然性。
  • k 值大(如 50):更多样,增加创新性。

Top-p Sampling(Nucleus Sampling,Top-p 采样)

  • 选择累计概率达到 p 的词集,不固定 k 值。
  • 低值(如 0.3):更确定,减少偶然性。
  • 高值(如 0.9):更多样,提升流畅度。

Repetition Penalty(重复惩罚)

  • 控制文本重复度,通常在 1.0-2.0 之间。
  • 值高(如 1.5):减少重复,提升可读性。
  • 值低(如 1.0):无惩罚,可能导致模型重复词句。

Max Tokens(最大生成长度)

  • 限制模型最多生成的 token 数,避免超长输出。
  • 典型范围:50-4096(依赖具体模型)。


设置好模型和参数后,在中间区域输入对话信息(可选择联网搜索与代码解释器)即可与模型展开对话。


相比于其它的 Chatbot,DeepSeek-R1 可以提供更完整的思考过程。


http://www.ppmy.cn/devtools/161515.html

相关文章

【1】VS Code 新建上位机项目---C#基础语法

VS Code 新建上位机项目---C#基础语法 1 基本概念1.1 准备工具1.2 新建项目2 C#编程基础2.1 命名空间和类2.2 数据类型2.3 控制台输入输出2.3.1 输入输出: write 与 read2.3.2 格式化 : string.Foramt() 与 $2.3.3 赋值与运算2.4 类型转换2.4.1 数值类型之间的转换:(int)2.4…

MATLAB实现四阶龙格库塔法求解常微分方程组

MATLAB实现四阶龙格库塔法求解常微分方程组 MATLAB实现四阶龙格库塔法求解常微分方程组/f.m , 107 MATLAB实现四阶龙格库塔法求解常微分方程组/RungeKutta.m , 844 MATLAB实现四阶龙格库塔法求解常微分方程组/四阶龙格库塔法求解常微分方程组.pdf , 93258

自注意力机制和CNN的区别

CNN:一种只能在固定感受野范围内进行关注的自注意力机制。​CNN是自注意力的简化版本。自注意力:具有可学习感受野的CNN。自注意力是CNN的复杂形态,是更灵活的CNN,经过某些设计就可以变为CNN。 越灵活、越大的模型,需要…

鸿蒙5.0实战案例:基于原生能力的深色模式适配

往期推文全新看点(文中附带全新鸿蒙5.0全栈学习笔录) ✏️ 鸿蒙(HarmonyOS)北向开发知识点记录~ ✏️ 鸿蒙(OpenHarmony)南向开发保姆级知识点汇总~ ✏️ 鸿蒙应用开发与鸿蒙系统开发哪个更有前景&#…

HTML之JavaScript DOM编程获取元素的方式

HTML之JavaScript DOM编程获取元素的方式 1.获得document DOM树window.document(是window的属性)2.从document中获取要操作的元素1.直接获取var aaa document.getElementById("username") // 根据元素的id值获取页面上的唯一一个元素,有同名的则返回找到的第一个var…

java23种设计模式-原型模式

原型模式(Prototype Pattern)学习笔记 🌟 定义 原型模式属于创建型设计模式,通过复制现有对象(原型)来创建新对象,避免重复进行初始化操作。该模式的核心是实现对象的克隆能力。 &#x1f3af…

Java基础进阶提升

(一)Java基础 面向对象java语法常用类,api数据类型方法、对象、引用运算符、操作符关键字、关键词 (二)java进阶 异常、异常分类与处理线程同步、守护线程多线程、IO流接口、多继承jdk、jre、jvm反射、泛型类继承、方法覆盖 (三)数据库 Mysql数据库Oracle数据库…

Cookie 与 localStorage_浏览器存储机制全解析

1. 引言 在现代 Web 开发中,浏览器存储机制是不可或缺的一部分。无论是保存用户偏好、会话信息还是缓存数据,选择合适的存储方式对于提升用户体验和应用性能至关重要。本文将深入探讨两种常见的浏览器存储机制:Cookie 和 localStorage。我们将详细介绍它们的基本概念、应用…