DeepSeek大模型系列

devtools/2025/2/4 18:37:03/

DeepSeek__5">DeepSeek 基本使用

对于DeepSeek 的使用来说,可以通过Web和APP两种方式就可以了:

  • Web网站使用地址: https://chat.deepseek.com/
  • APP的下载地址: https://download.deepseek.com/app/

以上两种方式注册账号就可以,使用是免费的。

DeepSeek__API_13">DeepSeek API调用方式

如果需要使用DeepSeek 做一些批量或进阶的事情,则需要使用调用API的方式。API的调用方式和OpenAI 类似, 以Python 语言为例,示例代码如下:

# Please install OpenAI SDK first: `pip3 install openai`from openai import OpenAIclient = OpenAI(api_key="<DeepSeek API Key>", base_url="https://api.deepseek.com")response = client.chat.completions.create(model="deepseek-chat",messages=[{"role": "system", "content": "You are a helpful assistant"},{"role": "user", "content": "Hello"},],stream=False
)print(response.choices[0].message.content)

API的调用是需要费用的,目前的价格如下:

在这里插入图片描述

DeepSeek___40">DeepSeek 模型系列和版本

如果要更细节的区分API调用的不同模型,或是将模型下载下来之后自行运行,则就需要区分不同的模型了,DeepSeek 官方站点显示的模型有以下:
在这里插入图片描述

这里还需要加上最近发布的DeepSeek-R1 模型(2025/01/20 发布)

看一下各主要版本的发布时间:

DeepSeekR1_52">DeepSeek-R1

  • DeepSeek-R1 遵循 MIT License,允许用户通过蒸馏技术借助 R1 训练其他模型。
  • 性能对齐 OpenAI-o1 正式版
    DeepSeek开源 DeepSeek-R1-Zero 和 DeepSeek-R1 两个 660B 模型的同时,通过 DeepSeek-R1 的输出,蒸馏了 6 个小模型开源给社区,其中 32B 和 70B 模型在多项能力上实现了对标 OpenAI o1-mini 的效果。

在这里插入图片描述


DeepSeek_LLM_63">DeepSeek LLM

  • 定位:通用领域大语言模型(基础模型)。
  • 特点
    • 支持自然语言理解、生成和多轮对话。
    • 覆盖广泛的知识领域,适用于通用问答、文本生成等任务。
    • 通常作为其他垂直领域模型的基座。

DeepSeek_Coder_72">DeepSeek Coder

  • 定位代码生成与理解专用模型。
  • 特点
    • 支持多种编程语言(Python、Java、C++等)。
    • 擅长代码补全、代码解释、调试及代码转换。
    • 可能采用代码相关数据集进行微调,优化代码上下文理解能力。
  • 典型应用:IDE插件、自动化编程工具。

DeepSeek_Math_82">DeepSeek Math

  • 定位数学推理与解题专用模型。
  • 特点
    • 针对数学问题(如代数、几何、数论)进行优化。
    • 支持分步推理、公式推导和解题过程解释。
    • 可能结合符号计算与自然语言处理技术。
  • 典型应用:教育辅助、数学工具集成。

DeepSeek_VLVisionLanguage_92">4. DeepSeek VL(Vision-Language)

  • 定位多模态视觉语言模型
  • 特点
    • 支持图像与文本联合理解(如图像描述、视觉问答)。
    • 可能集成目标检测、OCR等技术。
    • 适用于跨模态任务(如文档解析、图文生成)。
  • 典型应用:智能客服、内容审核、多媒体分析。

DeepSeek_V2__V3_102">DeepSeek V2 与 V3

  • 定位:通用模型的版本迭代
  • 差异
    • V2:可能优化了模型效率(如推理速度、显存占用)和上下文窗口长度。
    • V3:进一步强化多轮对话能力、知识更新及复杂指令跟随,可能引入更高效的架构(如MoE)。
    • 通常版本越高,综合性能越强,适用场景更广。

DeepSeek_Coder_V2_111">DeepSeek Coder V2

  • 定位:代码模型的升级版本
  • 改进点(相比初代Coder):
    • 支持更长的代码上下文(如32k tokens)。
    • 提升代码生成准确性及多语言覆盖。
    • 可能集成代码仓库检索或实时调试反馈。

总结对比表

模型核心领域典型能力版本迭代重点
DeepSeek LLM通用任务对话、文本生成基础能力扩展
Coder编程代码生成、解释多语言支持、上下文长度
Math数学解题、公式推导推理准确性
VL多模态(图像+文本)图文理解、生成跨模态对齐
V2/V3通用优化效率、多轮对话架构创新(如MoE)

注意事项

  • 具体技术细节(如参数量、训练数据)需参考官方文档或论文。
  • 部分模型可能仅限企业API或特定场景开放。
  • 建议通过 DeepSeek官网 获取最新信息。



http://www.ppmy.cn/devtools/156069.html

相关文章

TI 在 Yocto 项目中的应用解析

引言 Yocto 项目&#xff08;Yocto Project&#xff09;是一个广泛用于嵌入式 Linux 开发的开源项目&#xff0c;旨在提供一个灵活、可复用的工具链&#xff0c;以便为不同的硬件平台定制 Linux 发行版。德州仪器&#xff08;TI&#xff09;作为嵌入式系统领域的重要参与者&am…

Java 大视界 -- Java 大数据在智慧农业中的应用与实践(70)

&#x1f496;亲爱的朋友们&#xff0c;热烈欢迎来到 青云交的博客&#xff01;能与诸位在此相逢&#xff0c;我倍感荣幸。在这飞速更迭的时代&#xff0c;我们都渴望一方心灵净土&#xff0c;而 我的博客 正是这样温暖的所在。这里为你呈上趣味与实用兼具的知识&#xff0c;也…

csapp笔记3.6节——控制(1)

本节解决了x86-64如何实现条件语句、循环语句和分支语句的问题 条件码 除了整数寄存器外&#xff0c;cpu还维护着一组单个位的条件码寄存器&#xff0c;用来描述最近的算数和逻辑运算的某些属性。可检测这些寄存器来执行条件分支指令。 CF&#xff08;Carry Flag&#xff09…

最小生成树Prim算法

文章目录 最小生成树是什么Prim算法是什么模板 最小生成树是什么 最小生成树是使图中连接起来与小的最小代价 上边这张图的最小生成树就是下图 Prim算法是什么 Prim算法就是给你一个起点&#xff0c;每次找与这个点相邻边的最小值&#xff0c;直到遍历每个节点 模板 #incl…

android 音视频系列引导

音视频这块的知识点自己工作中有用到&#xff0c;一直没有好好做一个总结&#xff0c;原因有客观和主观的。 客观是工作太忙&#xff0c;没有成段时间做总结。 主观自己懒。 趁着这次主动离职拿了n1的钱&#xff0c;休息一下&#xff0c;对自己的人生做一下总结&#xff0c;…

解析 Oracle 中的 ALL_SYNONYMS 和 ALL_VIEWS 视图:查找同义词与视图的基础操作

目录 前言1. ALL_SYNONYMS 视图2. ALL_VIEWS 视图3. 扩展 前言 &#x1f91f; 找工作&#xff0c;来万码优才&#xff1a;&#x1f449; #小程序://万码优才/r6rqmzDaXpYkJZF 1. ALL_SYNONYMS 视图 在 Oracle 数据库中&#xff0c;同义词&#xff08;Synonym&#xff09;是对数…

Qt Creator 中使用 vcpkg

Qt Creator 中使用 vcpkg Qt Creator 是一个跨平台的轻量级 IDE&#xff0c;做 Qt 程序开发的同学们肯定对这个 IDE 都比较属于。这个 IDE 虽然没有 Visual Stdio 功能那么强&#xff0c;但是由于和 Qt 集成的比较深&#xff0c;用来开发 Qt 程序还是很顺手的。 早期&#xf…

实现网站内容快速被搜索引擎收录的方法

本文转自&#xff1a;百万收录网 原文链接&#xff1a;https://www.baiwanshoulu.com/6.html 实现网站内容快速被搜索引擎收录&#xff0c;是网站运营和推广的重要目标之一。以下是一些有效的方法&#xff0c;可以帮助网站内容更快地被搜索引擎发现和收录&#xff1a; 一、确…