AI驱动测试(五)模型参数解释

##模型常见的参数

1. 温度Temperature

在这里插入图片描述
温度（Temperature）是AI模型生成文本时的一个参数，主要影响输出的随机性和多样性。你可以把它想象成调节“创意”和“保守”之间的旋钮。

低温度（接近0）：模型会更保守，倾向于选择概率最高的词，输出更确定、一致，适合需要准确回答的任务。
高温度（大于1）：模型会更随机，选择更多样化的词，输出更具创意，但也可能不够连贯，适合需要多样性的场景。

简单来说，温度低时输出更稳定，温度高时输出更灵活。

2. Top-K

Top-K 是另一种控制文本生成多样性的参数，它决定了模型在每一步生成文本时，只从概率最高的 K 个词中选择下一个词，而不是从所有可能的词中选择。这样可以避免模型选择一些非常不相关或低概率的词，同时也能增加一定的多样性。

通俗解释：

想象一下，模型在生成文本时，手里有一大堆词可供选择，每个词都有一个概率（模型认为这个词合适的程度）。Top-K 的作用就是让模型只从“最合适的 K 个词”中随机挑选一个，而不是从所有词中随便选。

K 值小（比如 K=1）：模型会非常保守，每次都选择概率最高的那个词。输出结果会非常确定，但可能显得单调、重复。
K 值大（比如 K=100）：模型会从更多词中选择，输出结果更丰富多样，但也可能引入一些不太相关的词。

举个例子：

假设模型要生成一句话，下一步可选词的概率如下：

“猫”（概率 0.5）
“狗”（概率 0.3）
“鸟”（概率 0.1）
“鱼”（概率 0.05）
…（其他词概率更低）
如果 K=1，模型只会选择“猫”。
如果 K=3，模型会从“猫、狗、鸟”中随机选一个。
如果 K=10，模型可能会选到“鱼”或其他更低概率的词。

总结：

Top-K 小：输出更稳定、保守。
Top-K 大：输出更多样化，但也可能不够准确。

通常，Top-K 和温度参数可以结合使用，共同控制生成文本的多样性和质量。

3. Top-P

在这里插入图片描述
Top-P（也称为 Nucleus Sampling 或 P-Sampling）是另一种控制文本生成多样性的方法。它和 Top-K 类似，但更灵活。Top-P 不是固定选择概率最高的 K 个词，而是动态地选择概率累积达到一定阈值（P）的词。

通俗解释：

想象模型在生成文本时，手里有一堆词，每个词都有一个概率。Top-P 的做法是：

把这些词按概率从高到低排序。
从概率最高的词开始累加，直到累加的概率超过设定的阈值 P。
只从这些被选中的词中随机挑选下一个词。

举个例子：

假设模型下一步可选词的概率如下：

“猫”（概率 0.5）
“狗”（概率 0.3）
“鸟”（概率 0.1）
“鱼”（概率 0.05）
…（其他词概率更低）
如果 P=0.8：
- 累加概率：0.5（猫） + 0.3（狗） = 0.8，刚好达到阈值。
- 所以模型只会从“猫”和“狗”中随机选一个。
如果 P=0.9：
- 累加概率：0.5（猫） + 0.3（狗） + 0.1（鸟） = 0.9，达到阈值。
- 模型会从“猫、狗、鸟”中随机选一个。
如果 P=1.0：
- 所有词都会被考虑，模型可能会选到“鱼”或其他低概率的词。

Top-P 的特点：

P 值小（比如 P=0.5）：模型只会从概率最高的少数词中选择，输出更保守、稳定。
P 值大（比如 P=0.9）：模型会考虑更多词，输出更多样化。
P=1.0：模型会从所有词中随机选择，多样性最高，但也可能引入不相关的词。

Top-P 和 Top-K 的区别：

Top-K 是固定选择概率最高的 K 个词，不考虑这些词的总概率。
Top-P 是动态选择，直到累加概率超过 P，因此更灵活，能适应不同的上下文。

总结：

Top-P 小：输出更稳定、保守。
Top-P 大：输出更多样化。
Top-P 通常比 Top-K 更智能，因为它会根据上下文动态调整候选词的范围。

在实际应用中，Top-P 和温度参数常常结合使用，以更好地控制生成文本的质量和多样性。