AI驱动测试(五)模型参数解释

ops/2025/2/9 14:23:29/

##模型常见的参数

1. 温度Temperature

在这里插入图片描述
温度(Temperature)是AI模型生成文本时的一个参数,主要影响输出的随机性和多样性。你可以把它想象成调节“创意”和“保守”之间的旋钮。

  • 低温度(接近0):模型会更保守,倾向于选择概率最高的词,输出更确定、一致,适合需要准确回答的任务。

  • 高温度(大于1):模型会更随机,选择更多样化的词,输出更具创意,但也可能不够连贯,适合需要多样性的场景。

简单来说,温度低时输出更稳定,温度高时输出更灵活。

2. Top-K

Top-K 是另一种控制文本生成多样性的参数,它决定了模型在每一步生成文本时,只从概率最高的 K 个词中选择下一个词,而不是从所有可能的词中选择。这样可以避免模型选择一些非常不相关或低概率的词,同时也能增加一定的多样性。

通俗解释:

想象一下,模型在生成文本时,手里有一大堆词可供选择,每个词都有一个概率(模型认为这个词合适的程度)。Top-K 的作用就是让模型只从“最合适的 K 个词”中随机挑选一个,而不是从所有词中随便选。

  • K 值小(比如 K=1):模型会非常保守,每次都选择概率最高的那个词。输出结果会非常确定,但可能显得单调、重复。

  • K 值大(比如 K=100):模型会从更多词中选择,输出结果更丰富多样,但也可能引入一些不太相关的词。

举个例子:

假设模型要生成一句话,下一步可选词的概率如下:

  • “猫”(概率 0.5)

  • “狗”(概率 0.3)

  • “鸟”(概率 0.1)

  • “鱼”(概率 0.05)

  • …(其他词概率更低)

  • 如果 K=1,模型只会选择“猫”。

  • 如果 K=3,模型会从“猫、狗、鸟”中随机选一个。

  • 如果 K=10,模型可能会选到“鱼”或其他更低概率的词。

总结:

  • Top-K 小:输出更稳定、保守。
  • Top-K 大:输出更多样化,但也可能不够准确。

通常,Top-K 和温度参数可以结合使用,共同控制生成文本的多样性和质量。

3. Top-P

在这里插入图片描述
Top-P(也称为 Nucleus SamplingP-Sampling)是另一种控制文本生成多样性的方法。它和 Top-K 类似,但更灵活。Top-P 不是固定选择概率最高的 K 个词,而是动态地选择概率累积达到一定阈值(P)的词。

通俗解释:

想象模型在生成文本时,手里有一堆词,每个词都有一个概率。Top-P 的做法是:

  1. 把这些词按概率从高到低排序。
  2. 从概率最高的词开始累加,直到累加的概率超过设定的阈值 P。
  3. 只从这些被选中的词中随机挑选下一个词。

举个例子:

假设模型下一步可选词的概率如下:

  • “猫”(概率 0.5)

  • “狗”(概率 0.3)

  • “鸟”(概率 0.1)

  • “鱼”(概率 0.05)

  • …(其他词概率更低)

  • 如果 P=0.8

    • 累加概率:0.5(猫) + 0.3(狗) = 0.8,刚好达到阈值。
    • 所以模型只会从“猫”和“狗”中随机选一个。
  • 如果 P=0.9

    • 累加概率:0.5(猫) + 0.3(狗) + 0.1(鸟) = 0.9,达到阈值。
    • 模型会从“猫、狗、鸟”中随机选一个。
  • 如果 P=1.0

    • 所有词都会被考虑,模型可能会选到“鱼”或其他低概率的词。

Top-P 的特点:

  • P 值小(比如 P=0.5):模型只会从概率最高的少数词中选择,输出更保守、稳定。
  • P 值大(比如 P=0.9):模型会考虑更多词,输出更多样化。
  • P=1.0:模型会从所有词中随机选择,多样性最高,但也可能引入不相关的词。

Top-P 和 Top-K 的区别:

  • Top-K 是固定选择概率最高的 K 个词,不考虑这些词的总概率。
  • Top-P 是动态选择,直到累加概率超过 P,因此更灵活,能适应不同的上下文。

总结:

  • Top-P 小:输出更稳定、保守。
  • Top-P 大:输出更多样化。
  • Top-P 通常比 Top-K 更智能,因为它会根据上下文动态调整候选词的范围。

在实际应用中,Top-P 和温度参数常常结合使用,以更好地控制生成文本的质量和多样性。


http://www.ppmy.cn/ops/156997.html

相关文章

视频帧结构

视频帧结构是视频编码和传输的基础,它决定了视频数据的组织方式以及压缩效率。以下从多个维度详细解释视频帧的结构和相关概念: 1. 视频帧的基本概念 帧(Frame):视频由连续的静态图像(帧)组成&…

C++ 内存顺序与内存模型

内存顺序(与多线程有关) 我们都知道,c语法 多而杂,其中也有太多一致性…… C内存顺序作用 我们首先来看看,内存顺序是干嘛用的 【我们来进入以下场景:】 多线程程序中,所有线程共享同一片内存。但问题来…

Qt+海康虚拟相机的调试

做机器视觉项目的时候,在没有相机或需要把现场采集的图片在本地跑一下做测试时,可以使用海康的虚拟相机调试。以下是设置步骤: 1.安装好海康MVS软件,在菜单栏->工具选择虚拟相机工具,如下图: 2.打开虚拟…

【Spring】什么是Spring?

什么是Spring? Spring是一个开源的轻量级框架,是为了简化企业级开发而设计的。我们通常讲的Spring一般指的是Spring Framework。Spring的核心是控制反转(IoC-Inversion of Control)和面向切面编程(AOP-Aspect-Oriented Programming)。这些功能使得开发者…

FPGA高端项目:图像采集+UltraScale GTH光编码+UDP图传架构,高速接口转网络视频传输,提供工程源码和技术支持

目录 1、前言工程概述免责声明 2、相关方案推荐我已有的所有工程源码总目录----方便你快速找到自己喜欢的项目我这里已有的 GT 高速接口解决方案我这里已有的以太网方案 3、工程详细设计方案工程设计原理框图输入Sensor之-->OV5640摄像头动态彩条视频数据组包基于UltraScale…

C#绘制三维坐标系

1、代码 #region 三维坐标系的绘制private int axisLength30;[Category("坐标系")][Description("轴长")]public int AxisLength{get { return axisLength; }set { if(value>30) axisLength value; }}private int axisGap10;[Category("坐标系&q…

计算机领域QPM、TPM分别是什么并发指标,还有其他类似指标吗?

在计算机领域,QPM和TPM是两种不同的并发指标,它们分别用于衡量系统处理请求的能力和吞吐量。 QPM(每分钟请求数) QPM(Query Per Minute)表示每分钟系统能够处理的请求数量。它通常用于衡量系统在单位时间…

【Redis】redis 存储的列表如何分页和检索

博主介绍:✌全网粉丝22W,CSDN博客专家、Java领域优质创作者,掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java技术领域✌ 技术范围:SpringBoot、SpringCloud、Vue、SSM、HTML、Nodejs、Python、MySQL、PostgreSQL、大数据、物…