广义来讲,任何机器学习任务都可看成分类任务,
以商品类目分类为例:
商品鱼香肉丝大份
—— 类目为热菜
商品鱼香肉丝中份
—— 类目为热菜
商品鱼香肉丝小份
—— 类目为盖饭
如果数据中出现这样歧义的情况,则模型预测小份鱼香肉丝
时大概率会预测结果为盖饭
,
对于文本生成任务,比如让ChatGPT生成3条鱼香肉丝
的文案,
输入鱼香肉丝
—— ChatGPT文案为香辣可口
输入鱼香肉丝
—— ChatGPT文案为香辣适口
输入鱼香肉丝
—— ChatGPT文案为酸甜可口
无论文案结果对不对,但真正应用时,模型也是需要一个 无歧义 的训练数据集,
我们基于统计,可以得到做到这点,比如让ChatGPT多次生成鱼香肉丝
的文案,
统计出现次数最多的那个 输入-输出-pair,
类似我们也可让 同一条数据 给 多个人标注,然后选择“投票”最高的结果,
类似我们也基于统计,保留出 无歧义 的用户行为,作为训练数据集,比如用户的 搜索-订单 行为,
用户搜珍珠奶茶
—— 下单奶茶
用户搜珍珠奶茶
—— 下单奶茶
用户搜珍珠奶茶