【AI】增长迅猛的DeepSeek

embedded/2025/2/12 20:24:18/

DeepSeek-V3R1 两款模型的推出,犹如在 AI 行业投入了两颗重磅炸弹,DeepSeek 迅速成为

科技产业最耀眼的明星企业,并引发了巨大的讨论与关注。相较于各科技巨头不断构建更大规模

算力集群来训练更强大的模型,DeepSeek 向大家展示了通过精巧的算法优化,可以在低一个数

量级算力消耗的情况下生产出顶尖性能的模型。

DeepSeek 已经成为众多科技领域领袖重点关注的对象:微软 CEO 纳德拉在财报电话会议上称

DeepSeek“有一些真的创新”,并透露 R1 模型已经可以通过微软的 AI 平台获取;Meta CEO

克伯格表示 Meta DeepSeek 视为竞争对手并正在学习;ASML CEO 则在接受采访时 表示

DeepSeek 这样的低成本模型将带来更多而非更少的 AI 芯片需求;Anthropic 创始人认为 V3 是真

正的创新所在;人工智能专家吴恩达也发文认为中美 AI 差距正在迅速缩小。OpenAI CEO 山姆奥

特曼更是在发布 o3-mini 后罕见地承认“在开源上 OpenAI 站在了历史的错误一方”。

在超高的热度下,DeepSeek 成为了全球增速最快的 AI 应用,仅上线 18 天日活就达到了 1500

万,而 ChatGPT 1500 万花了 244 天,增速是 ChatGPT 13 倍;1 26 日同时登顶苹果

App Store 和谷歌 Play Store 全球下载榜首,目前仍然在 100 多个多家/地区维持领先。

从上图可以看到,自从推理模型R1版本推出,下载量出现了快速的增长势头。

在大陆运行ChatGPT,有不少限制,虽然研究的很多,但不能很方便的注册,甚至由于它的出现,带动了很多VPN的爆赚。当然,这是做得说不得的事情。

目前VPN的价格,确实出现了水涨船高的现象,很多小的也受到了打击,或者无法付款的情况出现。

据披露,DeepSeek-V3 为自研 MoE 模型,总参数 671B 参数,而每项任务仅激活 37B,在 14.8T

token 上进行了预训练。DeepSeek-V3 实现了多项工程技术上的创新,包括通过 FP8 精度训练、

DualPipe双向流水线等技术降低训练成本,通过优化MoE负载均衡、多头潜在注意力机制(MLA

来降低推理成本,并通过多 Token 预测(MTP)以及模型蒸馏来进一步提升模型性能,最终取得

了令人惊艳的效果。

 


http://www.ppmy.cn/embedded/161683.html

相关文章

Linux ARM64 将内核虚拟地址转化为物理地址

文章目录 前言一、通用方案1.1 kern_addr_valid1.2 __pa 二、ARM64架构2.1 AT S1E1R2.2 is_kernel_addr_vaild2.3 va2pa_helper 三、demo演示参考资料 前言 本文介绍一种通用的将内核虚拟地址转化为物理地址的方案以及一种适用于ARM64 将内核虚拟地址转化为物理地址的方案&…

Ollama命令使用指南

Ollama 命令使用指南 Ollama 命令使用指南1. Ollama 命令概览2. Ollama 命令详解2.1 启动 Ollama2.2 创建模型2.3 查看模型信息2.4 运行模型2.5 停止运行的模型2.6 从注册表拉取模型2.7 推送模型到注册表2.8 列出本地模型2.9 查看正在运行的模型2.10 复制模型2.11 删除模型 3. …

索引为什么是B+树结构,MySQL有哪些引擎,有什么区别?

目录 为什么索引使用 B+ 树结构? 1. 适合磁盘存储 2. 高效的查询性能 3. 适合大数据量 4. 与 B 树的区别 MySQL 的存储引擎及区别 1. InnoDB 2. MyISAM 3. Memory 4. Archive 5. CSV 6. Blackhole 存储引擎的选择建议 总结 为什么索引使用 B+ 树结构? B+ 树是…

Unity状态机相关

Unity状态机(Animator)详解 一、基本概念 1. 什么是状态机 用于管理动画状态的系统控制角色/物体的不同状态切换基于条件驱动的状态转换可视化的动画编程工具 2. Animator组件 Unity内置的动画控制器组件连接状态机和游戏对象管理动画权重和过渡支持…

vue 134~152

认识Vue3 1. Vue2 选项式 API vs Vue3 组合式API <script> export default {data(){return {count:0}},methods:{addCount(){this.count}} } </script><script setup> import { ref } from vue const count ref(0) const addCount ()> count.value &l…

Java 读取 PDF 模板文档并替换内容重新生成 PDF

朋友们&#xff01;在实际开发里&#xff0c;经常会遇到需要根据 PDF 模板文档生成特定 PDF 的需求&#xff0c;比如合同、证书等。咱们可以借助 iText 库来实现读取 PDF 模板文档、替换指定内容&#xff0c;最后重新生成新 PDF 的功能。下面我就详细给大家讲讲具体怎么做。 1.…

Failed to build mysqlclient

​​​​​​​Links for mysqlclient 在上述链接下载对应版本即可。 Installing build dependencies ... done Getting requirements to build wheel ... done Preparing metadata (pyproject.toml) ... done Building wheels for collected packages: mysqlclient Bui…

制药行业 BI 可视化数据分析方案

一、行业背景 随着医药行业数字化转型的深入&#xff0c;企业积累了海量的数据&#xff0c;包括销售数据、生产数据、研发数据、市场数据等。如何利用这些数据&#xff0c;挖掘其价值&#xff0c;为企业决策提供支持&#xff0c;成为医药企业面临的重大挑战。在当今竞争激烈的…