【大模型实战篇】DeepSeek-R1面临的DDOS攻击以及与O系列的差距

server/2025/3/1 6:22:09/

1. 问题 

        虽然不可否认DeepSeek-R1作为一款大模型表现出色,其开源也推动了技术的进步。然而,在这份热闹的背后,我们仍需保持冷静。该推理模型在某些特殊场景下存在问题:其think过程可能会持续不断地输出,直到达到token上限后才会停止。这不仅会导致大量token的消耗,还可能直接造成算力和资金的浪费。并且无法接收新的真正请求,GPU资源可能被占满,导致大模型的DDOS问题产生。

2. DeepSeek-R1 ddos现象

        输入:树中两条路径之间的距离。

        DeepSeek处于一直输出think过程,不能输出终止的token。 最后只能强制停止think过程了。

3. O系列表现

初步结论:

        O系列模型,一直处于第一梯队,表现很稳定。

        希望deepseek能继续加油,带来更好的推理模型,听说5月会带来R2模型。


http://www.ppmy.cn/server/171480.html

相关文章

Ubuntu 下 nginx-1.24.0 源码分析 - ngx_list_t

ngx_list_t 定义在 src/core/ngx_list.h typedef struct {ngx_list_part_t *last;ngx_list_part_t part;size_t size;ngx_uint_t nalloc;ngx_pool_t *pool; } ngx_list_t;ngx_list_t 是 Nginx 中用于管理动态数组链表的核心数据结构,结…

kotlin的lateinit声明 的变量可能为null吗?

kotlin的lateinit声明 的变量可能为null吗? DeepSeek R1 思考 26 秒 思考过程 嗯,用户问的是Kotlin中的lateinit变量是否可能为null。首先,我需要回顾一下lateinit的作用和特性。lateinit用于延迟初始化一个非空类型的变量,这样…

6.6.3 SQL数据查询(一)

文章目录 SELECT语句简单查询连接查询子查询聚集函数 SELECT语句 SELECT是用于查询的动词,基本格式为SELECT-FROM-WHERE,其中WHERE可选。SELECT对应投影运算,FROM对应笛卡尔积运算,WHERE对应选择运算。选择使用的条件表达式p可包含…

Python入门 — 类

面向对象编程中,编写表示现实世界中的事物和情景的类(class),并基于这些类来创建对象(object)。根据类来创建对象称为实例化,这样就可以使用类的实例(instance) 一、创建…

开发基于提示工程的大语言模型(LLM)应用——学习笔记

本文是学习笔记。学习通过提示工程与大语言模型进行程序化的交互。 将从最基本的开始,比如使用哪些模型,以及如何向它们发送提示词并查看响应。 将逐步构建更复杂的提示词,并学习 LangChain 为我们提供的、用于与大语言模型交互的丰富工具。…

使用优化版的编辑距离算法替代ES默认的评分算法

优化版编辑距离算法 public static int minDistance(String str, String str1) {int len str.length(), len1 str1.length();// 预处理char[] arr1 str.toCharArray();char[] arr2 str1.toCharArray();// 动态规划数组int[] dp new int[len1 1];for (int j 0; j < le…

Rust ~ Vec<u8>和[u8]

Vec<u8> 和 &[u8] 是两种不同的数据类型&#xff0c;它们都与字节序列相关&#xff0c;但在所有权、内存管理、使用场景等方面存在明显区别 类型本质 Vec<u8>&#xff1a;Rust 中的动态数组类型&#xff0c;即向量&#xff08;vector&#xff09;。它是一个拥…

二、IDE集成DeepSeek保姆级教学(使用篇)

各位看官老爷好&#xff0c;如果还没有安装DeepSeek请查阅前一篇 一、IDE集成DeepSeek保姆级教学(安装篇) 一、DeepSeek在CodeGPT中使用教学 1.1、Edit Code 编辑代码 选中代码片段 —> 右键 —> CodeGPT —> Edit Code, 输入自然语言可编辑代码&#xff0c;点击S…