DeepSeek推动大语言模型发展进入新阶段

news/2025/2/7 21:22:17/

过年,最火的还是国产AI,无论是Deepseek V3 R1模型超越ChatGPT 4o,还是国产机器人春晚亮相,不仅让国人眼前一亮,也让IT界大跌眼镜。

一、Deepseek的影响力

Deepseek仅凭一己之力,让英伟达芯片商总市值大跌5520亿美元,就连特朗普也不得不承认,来自中国公司的AI模型“DeepSeek”给我们(美国)的AI行业敲响警钟。

Deepseek以550万美元极少的资金投入和数十人的研发团队,训练出了与美国上亿资金训练出的ChatGPT-4o付费性能不相上下的大语言模型,让世界惊叹AI的中国速度,但也开始质疑Deepseek是否窃取了Chatgpt的技术。

二、Deepseek遭受攻击

从2025年1月26日以来,Deepseek网页、APP和API都遭到了来自大量美国IP的DDos攻击,其猛烈程度简直难以置信。360、华为、腾讯等国产IT厂商,挺身而出,为Deepseek提供网络防护、服务器保障,全力为国产AI保驾护航。

从被攻击开始网站响应速度慢、APP无法使用,到今天,Deepseek已经可以正常使用,而且还推出了用于智能绘图的模型:Janus Pro,再一次震动IT界。

360在其纳米搜索平台,推出Deepseek V3 R1模型的高速专线,用户可以在其平台快速使用deepseek的深度思考模型。

360在其纳米搜索平台,推出Deepseek V3 R1模型的高速专线,用户可以在其平台快速使用deepseek的深度思考模型。

360纳米助手中可以使用Deepseek

Siliconflow平台也推出了Deepseek-R1和Deepseek Janus-pro两个主流大语言模型,用户可以利用Python调用其api,应用到个人项目中。我还注意到Janus-Pro-7B这个智能绘图模型竟然还免费。

Siliconflow 上面的Deepseek模型

目前,这个开源模型的APP下载量超越ChatGPT,登顶140个国家APP应用商店下载量榜首。这是继小红书大火之后,又一波世界级流量涌向Deepseek。

在惊呼“狼来了”的同时,包括意大利、爱尔兰的多个国家已经开始禁止或限制Deepseek在应用商店中的下载。一个国产APP能有这么大影响力实属罕见。

三、Deepseek的性能如何?

网上,一直有人问Deepseek到底怎么厉害了,看起来和其它的AI没有什么区别,感觉还不如豆包。

Deepseek是新兴的国产大语言模型,虽然没有讯飞、文心一言等大模型问世的早,但其性能在多个领域比肩ChatGPT,尤其擅长代码编程、数学计算和逻辑推理。

有人把一道顶级难度的高考数学题喂给Deepseek,短短数秒,它就能给出正确的解题思路和答案。相比之下,其在深度思考能力、生成答案速度、API调用价格等方面,远远强于其它国产大语言模型.

Deepseek的性能比肩Chatgpt-4o

更为重要的是,其1元50万tokens的API价格,不足ChatGPT的十分之一,简直就是白菜价。而且注册首月用户还免费得到500万的tokens。1月到期后,用户只需花10元钱就又可以买500万的tokens.

有了Deepseek,网友可能再也不用想方设法登录ChatGPT了,用Python调用API也不用担心额度不够用了。

四、Deepseek的应用

Deepseek已经被广泛应用于外语教学、软件开发、时闻锐评、数据分析、数学题解析等方面。而我,通常也会把它与自己手头上的一些小项目结合。

比如,我遇到这样的一个案例,手动有上万的中文文本,但其中引号用的是英文的引号,如果我想把其改为中文引号,无论是手工还是编程,都非常的麻烦,而且容易出错,我只用给出一条命令,让其修复文本中的引号,就可以很快得到应用的效果,而且准确无误。

修复下面文本中的标点符号,尤其是双引号:老张上个月查出糖尿病,在菜市场碰见我时,手里攥着两个芋头直叹气:"都说这玩意能降糖,可我吃完血糖还是蹭蹭涨!"这话让我想起门诊里八成糖友都犯过的迷糊——把"低升糖"当"降糖药",结果越吃越糟糕。今儿咱们就掰开芋头看看门道,再聊聊饭桌上那些既能解馋又不让血糖坐过山车的好主食。

在另一个案例中,我把上万字不带标点的双语字幕喂给Deepseek,它就可以帮我进行自然断句,修复标点和单词拼写,并按照提示词改写句段,修改润色译文,一部几十k的视频的字幕就可以轻松转化为双语文本了。这下,本来了几个小时的任务,只需要1分钟就搞定了

当前,网络上已经有人使用Ollama来下载Deepseek R1 1.5B模型,同时用AnythingLLM和Deepseek的API搭建知识库,开启本地的智能问答服务。不方便下载本地的用户,也可以使用其免费的网页版和APP,Deepseek这样一个人人可用的AI工具已经诞生。

五、Openai反击

现在,Deepseek PK ChatGPT的大幕已经拉起。就在刚刚,Openai发动反击,发布新模型Deep Research。据说Deep Research更加智能,它可以像数据分析师一样,智能拆解任务,并通过互联网进行多轮信息搜索与验证,不断深入发掘问题的本质,直至找到最佳的答案。其性能据说已经超过了Deepseek的R1模型2.8倍,那么接下来,就看Deepseek如何接招了。

AI的内卷还在继续,大语言模型的发展必将进入一个新的阶段,让我们拭目以待...


http://www.ppmy.cn/news/1570155.html

相关文章

C中静态库和动态库的使用

2.使用尖括号包括 如果要使用尖括号包括头文件,有两种方法 1.将头文件移动到标准头文件目录,linux为/usr/local/include.windows下为C:\MinGW\include 2.编译时指定头文件目录,gcc -I/头文件目录 … 编译时-I参数就是用于指定头文件目录 3.静态库 将文件编译为静态库,可以…

低代码提升交付效率的公式计算

低(无)代码平台(后统称“低代码”)能够提升数字化应用建设、交付效率,已经成为IT从业人员的共识。目前,大部分CIO/CDO都能清晰定位和认知低代码的特点和作用。但仍然有人认为,使用了低代码工具软…

开放式TCP/IP通信

一、1200和1200之间的开放式TCP/IP通讯 第一步:组态1214CPU,勾选时钟存储器 第二步:防护与安全里面连接机制勾选允许PUT/GET访问 第三步:添加PLC 第四步:点击网络试图,选中网口,把两个PLC连接起…

HTML5教程之标签(2)

HTML5 <b> 标签 实例 在HTML5中&#xff0c;你可以使用<b>标签来对某些文本实现加粗的效果&#xff0c;请参考下述的示例&#xff1a; <p>这是一个普通的文本- <b>这是一个加粗文本</b>。</p> 尝试一下 浏览器支持 所有主流浏览器都支…

【C语言】自定义类型讲解

文章目录 一、前言二、结构体2.1 概念2.2 定义2.2.1 通常情况下的定义2.2.2 匿名结构体 2.3 结构体的自引用和嵌套2.4 结构体变量的定义与初始化2.5 结构体的内存对齐2.6 结构体传参2.7 结构体实现位段 三、枚举3.1 概念3.2 定义3.3 枚举的优点3.3.1 提高代码的可读性3.3.2 防止…

游戏引擎 Unity - Unity 打开项目、Unity Editor 添加简体中文语言包模块、Unity 项目设置为简体中文

Unity Unity 首次发布于 2005 年&#xff0c;属于 Unity Technologies Unity 使用的开发技术有&#xff1a;C# Unity 的适用平台&#xff1a;PC、主机、移动设备、VR / AR、Web 等 Unity 的适用领域&#xff1a;开发中等画质中小型项目 Unity 适合初学者或需要快速上手的开…

苹果AR眼镜:产品规划与战略路线深度解析

随着增强现实(AR)技术的不断发展,苹果公司正逐步推进其AR智能眼镜项目。尽管Vision Pro作为一款高端混合现实设备已经面世,但苹果真正的目标是开发出一款轻便、全天候佩戴且能够取代智能手机功能的AR眼镜。本文将梳理苹果在AR领域的探索历程,并分析其当前的产品状态及未来…

Java 网络原理 ③-NAT || DHCP

这里是Themberfue 上篇文章我们简单介绍了 IP 协议 的首部字段的含义&#xff0c;这节课我们将继续深入 IP 协议~~~ DHCP 上节课我们提到&#xff0c;IPv4 使用点分十进制的方式管理地址&#xff0c;但是 IPv4 最多分配43亿个地址&#xff0c;早在2019年&#xff0c;IPv4 的地…