1. 问题
虽然不可否认DeepSeek-R1作为一款大模型表现出色,其开源也推动了技术的进步。然而,在这份热闹的背后,我们仍需保持冷静。该推理模型在某些特殊场景下存在问题:其think过程可能会持续不断地输出,直到达到token上限后才会停止。这不仅会导致大量token的消耗,还可能直接造成算力和资金的浪费。并且无法接收新的真正请求,GPU资源可能被占满,导致大模型的DDOS问题产生。
2. DeepSeek-R1 ddos现象
输入:树中两条路径之间的距离。
DeepSeek处于一直输出think过程,不能输出终止的token。 最后只能强制停止think过程了。
3. O系列表现
初步结论:
O系列模型,一直处于第一梯队,表现很稳定。
希望deepseek能继续加油,带来更好的推理模型,听说5月会带来R2模型。