ACL2023论文-系列1

news/2025/2/12 23:13:23/

文章目录

  • Prompt——1.Generated Knowledge Prompting for Commonsense Reasoning
      • 核心
      • 论文贡献
      • 方法效果的影响因素
      • 方法实现
  • Contrastive learning——A Contrastive Framework for Learning Sentence Representations from Pairwise and Triple-wise Perspective in Angular Space
      • 核心
        • 训练目标1:对比学习
        • 学习目标2:Triple-wise
        • 总目标

Prompt——1.Generated Knowledge Prompting for Commonsense Reasoning

核心

是把常识知识融入到prompt,用于推理。
生成知识提示,包括从语言模型中生成知识,然后在回答问题时提供知识作为额外输入。

在这里插入图片描述

生成知识提示包括:
(i) 使用少量演示,从语言模型中生成与问题相关的知识陈述;
(ii) 使用第二个语言模型对每个知识陈述进行预测,然后选择置信度最高的预测。

论文贡献

1.调研了外部知识是否对于常识推理有帮助
2.从LLM中产生有用的知识,然后将这些知识融入到带问题的prompt中。

方法效果的影响因素

1.知识的质量
2.知识的数量
3.融入知识的策略(strategy for integrating knowledge during inference)——(1.no knowledge 2. random sentence 3. context sentences 4.template-generated knowledge 5. retrieval-based knowledge )

方法实现

1.知识生成:利用语言模型基于question生成knowledge statements。
2. 知识融合:生成的知识融入,用于决策推断。
3.在推理时,使用每个generated knowledge statement 做预测,然后,选择highest-confidence 作为最终的prediction。
q表示question,k表示knowledge
在这里插入图片描述
选择置信度最大的作为最终的结果输出。
在这里插入图片描述

Contrastive learning——A Contrastive Framework for Learning Sentence Representations from Pairwise and Triple-wise Perspective in Angular Space

pairwise (成对)
triple-wise (三元组)

核心

用角度代替了infoloss中的distance,要克服PLM学习到的semantic represenation是各项异性的缺点.
训练目标: Additive Angular Margin Contrastive Loss (ArcCon Loss)。它通过最大化角度空间中的判定余量来增强成对判别能力。
positive pairs: 同一个sentence做的不同rate的dropout.
negetive pairs: the representations of different sentences within the same batch.

训练目标1:对比学习

原来的contrastive learning objective:
在这里插入图片描述

论文中使用的additive angular margin :

在这里插入图片描述
其中,θ的计算公式如下:
在这里插入图片描述

学习目标2:Triple-wise

对于文本数据集 D 中的每个句子 si,我们首先以20% 的屏蔽率屏蔽 si 的连续片段,生成外部句子 s ′ i。然后,我们扩大屏蔽区域,得到一个新句子 s ′′ i,屏蔽率为 si 的 40% .
假设条件: mask=20% 的句子比mask=40%的句子更相似。

在这里插入图片描述

总目标

Larc是角度下的对比学习目标,Ltri是三元组相似度学习目标。
在这里插入图片描述


http://www.ppmy.cn/news/959353.html

相关文章

人人都可实测体验的ChatGPT来了

来源:量子位 所有人都能上手微软Bing了! 今天,微软突然官宣全面开放BingChat: 无需任何等待。只需注册一个账户,首页即可体验。 更关键的是,还有一大堆堪称“家底”的新功能来袭! 支持100种语言…

文心一言 ChatGPT 实测对比

期待已久之后,终于拿到了文心一言的邀请码,第一时间进行了测试。最后面会讲一下如何获取邀请码。 先说一下结论,很远,但是又不远。 很远是因为:我个人测试得出来的实际效果和ChatGPT差距还很大,下面我会放…

chatgpt VS 文心一言使用对比实测

chatgpt VS 文心一言使用对比实测 什么是文心一言 文心一言(英语:ERNIE Bot)是由百度公司开发的聊天机器人,能够与人交互、回答问题及协作创作。该产品被传媒称为国际著名聊天机器人ChatGPT的中国版及其竞争对手[1][2]。目前已开…

chrome 报错connection is not private. NET::ERR_CERT_COMMON_NAME_INVALID Provisional headers warning

问题 Your connection is not private Attackers might be trying to steal your information from (for example, passwords, messages, or credit cards). NET::ERR_CERT_COMMON_NAME_INVALID 这个错误可能说明网站证书有问题。 如果你已经尝试了重启、清缓存、重装浏览器都…

JavaScript基础篇(11-20题)

此文章,来源于印客学院的资料【第一部分:基础篇(105题)】,也有一些从网上查找的补充。 这里只是分享,便于学习。 诸君可以根据自己实际情况,自行衡量,看看哪里需要加强。 概述如下: 模块化开…

AutoHotKey实现双击Chrome标签位置关闭标签页(ChatGPT辅助编写)

实现目标:双击关闭Chrome标签页,相较于 MaxAlex 的版本,只保留双击关闭标签,不然滚轮滚多了会弹窗。 共四步 1.安装atuohotkey最新版本 2.新建一个文本文档,更改名字比如为为test.ahk, 但是要后缀名为ahk 3…

假冒的ChatGPT浏览器扩展被发现劫持Facebook账户

谷歌已介入从官方网上商店中删除伪装成 OpenAI 的 ChatGPT 服务的虚假 Chrome 浏览器扩展程序,以获取 Facebook 会话 cookie 并劫持帐户。 “ChatGPT For Google”扩展程序是合法开源浏览器插件的木马化版本,自 2023 年 3 月 14 日被删除以来吸引了超过…

【AI人工智能】 你如果要使用最强大的语言模型,首先你先要有Chrome浏览器! (1)

🚀 个人主页 极客小俊 ✍🏻 作者简介:web开发者、设计师、技术分享博主 🐋 希望大家多多支持一下, 我们一起进步!😄 🏅 如果文章对你有帮助的话,欢迎评论 💬点赞&#x1…