前沿探索|关于 AIGC 的「幻觉/梦游」问题

news/2024/11/20 7:28:12/

AI语言模型的梦游是指模型产生内容与真实世界不符或者是毫无意义的情况。这种情况主要是由于语言模型缺乏真实世界的知识和语言的含义,导致模型难以理解和表达现实世界的概念和信息。这种情况在现代自然语言处理中普遍存在,尤其是在开放式生成领域的问题中。

目录

  • 深度学习的不确定性
    • 偶然不确定性
    • 认知不确定性
  • 多模态模型的幻觉问题


深度学习的不确定性

深度学习的不确定性主要包括偶然不确定性和认知不确定性。

偶然不确定性

偶然不确定性无法消除,它来源于数据本身的噪声或者标签的噪声,针对噪声标签目前主流的做法主要包括下面四类:

  • 损失函数校正: the robustness of models against noisy label can be enhanced by adjusting the loss function
  • 转移矩阵估计: Modeling the corruption of noisy label using the transition matrix
  • 一致性正则化: Train multiple models in parallel for self-ensemble
  • 选择性采样: Reduce noisy ratio by selecting samples

认知不确定性

认知不确定性是我们模型中存在的不确定性。就拿我们文章一开始举的例子来说,假设我们训练一个分类人脸和猩猩脸的模型,训练中没有做任何的增强,也就是说没有做数据集的旋转,模糊等操作。如果我给模型一个正常的人脸,或者是正常猩猩的脸,我们的模型应该对他所产生的结果的置信度很高。但是如果我给他猫的照片,一个模糊处理过得人脸,或者旋转90°的猩猩脸,模型的置信度应该会特别低。换句话说,认知不确定性测量的,是我们的input data是否存在于已经见过的数据的分布之中。


多模态模型的幻觉问题

  1. Object Hallucination in Image Captioning (EMNLP, 2018) UC Berkeley & Boston University

    代码:https://github.com/LisaAnne/Hallucination

    PS:这几位作者还发表过一篇关于模型纠偏的工作,比较有意思:Women Also Snowboard: Overcoming Bias in Captioning Models (ECCV, 2018)

  2. On Hallucination and Predictive Uncertainty in Conditional Language Generation (EACL, 2021) University of California, Santa Barbara

  3. Let there be a clock on the beach:Reducing Object Hallucination in Image Captioning (WACV, 2022) Computer Vision Center, UAB, Spain

    代码:https://github.com/furkanbiten/object-bias/tree/main

  4. Plausible May Not Be Faithful: Probing Object Hallucination in Vision-Language Pre-training (EACL, 2023) The Hong Kong University of Science and Technology

    代码:https://github.com/wenliangdai/VLP-Object-Hallucination

  5. Deconfounded Image Captioning: A Causal Retrospect (TPAMI, 2021)


后记:一些相关研究方向:
- 价值观引导(大模型紧箍咒):抑制、控制生成文本,属于可控文本生成的范畴;
- 生成幻觉的检测与避免(不论是多模态文本生成(image captioning)还是单模态文本生成,都存在这一问题)
- 文本纠偏(用别人分类或检测的数据迁移到该任务,旨在消除生成的负面)

参考文献

  1. Survey of Hallucination in Natural Language Generation (ACM Computing Surveys, 2023) 港科
  2. Hallucination in Text Generation - 知乎 (zhihu.com)
  3. GPT-4的“hallucination”(幻觉)相关对策 - 知乎 (zhihu.com)
  4. Survey of Hallucination in Natural Language Generation-语言模型幻想问题半文翻译&解读 - 知乎 (zhihu.com)
  5. 偏差(bias)与混淆(confounding) - 知乎 (zhihu.com)
  6. 深度学习不确定性的分类 - 知乎 (zhihu.com)
  7. 深度学习中的两种不确定性(上) - 知乎 (zhihu.com)

http://www.ppmy.cn/news/1039146.html

相关文章

基线与基线检查

目录 一、什么是基线 二、安全基线与配置核查 三、常见安全配置问题 四、配置检查目的 五、配置检查标准 六、基线检查标准 七、安全基线与漏扫的异同 相同点 不同点 八、安全基线体系 九、安全配置核查关注什么 口令策略 文件权限 用户账户 系统服务 认证授权 网络通…

Docker容器:docker基础概述、docker安装、docker网络

文章目录 一.docker容器概述1.什么是容器2. docker与虚拟机的区别2.1 docker虚拟化产品有哪些及其对比2.2 Docker与虚拟机的区别 3.Docker容器的使用场景4.Docker容器的优点5.Docker 的底层运行原理6.namespace的六项隔离7.Docker核心概念 二.Docker安装 及管理1.安装 Docker1.…

如何收缩wsl2虚拟磁盘

简介 WSL2使用虚拟化层为它带来更高的性能和兼容性。但是,WSL2 的少数缺点之一是它使用虚拟磁盘 (VHDX) 来存储文件系统。这意味着您的虚拟磁盘占用了 100GB,但 WSL2 只需要 15GB... 所以要寻找一种缩小 WSL2 虚拟磁盘的方法&…

8月14-15日上课内容 LVS负载均衡的群集

知识点: 本章结构: 企业群集概述 集群的含义: 1、群集的含义 ①、Cluster、集群、群集 ②、由多台主机构成,但对外只表现为一个整体,只提供一个访问入口(域名与IP地址),相当于一台大型计算机。…

2022 ICPC 沈阳 L(模拟 , dfs)

2022 ICPC 沈阳 L(模拟 , dfs) Problem - L - Codeforces 大意:给出两支队伍 , 交替发动攻击 , 问两支队伍分别获胜和平局的概率。 一:先手规则: 两队轮流发动攻击(take turns) ,人数多的先…

linux 的swap、swappiness及kswapd原理【转+自己理解】

本文讨论的 swap基于Linux4.4内核代码 。Linux内存管理是一套非常复杂的系统,而swap只是其中一个很小的处理逻辑。 希望本文能让读者了解Linux对swap的使用大概是什么样子。阅读完本文,应该可以帮你解决以下问题: swap到底是干嘛的&#xf…

【C++】set/multiset容器

1.set基本概念 #include <iostream> using namespace std;//set容器构造和赋值 #include<set>//遍历 void printSet(const set<int>& st) {for (set<int>::const_iterator it st.begin(); it ! st.end(); it){cout << *it << " …

也许你正处于《孤注一掷》中的“团队”,要留心了

看完这部电影&#xff0c;心情久久不能平静&#xff0c;想了很多&#xff0c;倒不是担心自己哪天也成为“消失的yaozi”&#xff0c;而是在想&#xff0c;我们每天所赖以生存的工作&#xff0c;跟电影里他们的工作比&#xff0c;差别在哪里呢&#xff1f; 目录 1. 产品的本质…