【NLP 48、大语言模型的神秘力量 —— ICL:in context learning】

server/2025/3/31 6:44:36/

目录

一、ICL的优势

1.传统做法

2.ICL做法

二、ICL的发展 

三、ICL成因的两种看法

1.meta learning

2.Bayesian Inference

四、ICL要点

语言模型的规模

② 提示词prompt中提供的examples数量和顺序

③ 提示词prompt的形式(format)

五、fine-tune VS ICL


不要抓着枯叶哭泣,你要等待初春的芽

                                                —— 25.3.26

一、ICL的优势

1.传统做法

任务定义 ——> 建立标注规范 ——> 标注人员学习标注规范 ——> 标注人员进行标注 ——> 对标注结果进行审核 ——> 使用标注数据训练模型 ——> 模型验证效果 ——> 模型实际预测

2.ICL做法

任务定义 ——> 模型实际预测

ICL方法如果完全成熟,意味着fine-tune范式的终结


二、ICL的发展 

关于ICL的成因,目前学术界没有被广泛认可的解释,只有若干假说和一些表现分析。

在GPT3的论文中,z-s【zero-shot】,o-s【one-shot】,f-s【few-shot】都属于ICL 


chain-of-thought思维链属于ICL


GPT3给出参考:在输入中加入至少一个样本,能大幅提升ICL效果

对于一个较大的模型而言,给出一个例子就可以显著的提升ICL的效果,给出Few-shot,准确性还会有所提升

对于一个较弱的模型而言,给出多少例子都不会显著提升ICL的效果


fine-tune会伤害ICL能力


精巧的提示词prompt设计有可能超过os、fs,可以通过提示词的改写进一步提高ICL的能力 


Magical word

不给出思维链,而是在输入时多加入一句提示词,需要模型一步步思考:Let's think step by step

模型就可以像思维链一样主动发出思考,最终输出正确的结果


ICL时输入错误样本,不一定影响准确率

我们发现,用随机标签替换正确标签只会略微影响性能,这一趋势在几乎整个过程中是一致的


ICL可以压倒先验知识


三、ICL成因的两种看法

1.meta learning

大模型能在内部训练小型网络

2.Bayesian Inference

模型任务可以看作一个贝叶斯一样的多条件概率的组合,pretrain、prompt、example三者条件概率的组合,三者皆对于最终概率有影响


四、ICL要点

语言模型的规模

语言模型需要达到一定的规模

② 提示词prompt中提供的examples数量和顺序

给出的示例样本的数量和顺序也会影响模型效果的好坏

③ 提示词prompt的形式(format)

提示词的格式也十分重要,好的模型会根据你给出的格式回答你的问题


五、fine-tune VS ICL


http://www.ppmy.cn/server/179718.html

相关文章

网络安全之开放式系统互联参考模型

对于HCIA HCIP的相关了解 1.1什么是HCIA? (Huawei Certified ICT Associate)是华为认证体系中的初级认证,全称为“华为认证ICT工程师”。该认证旨在帮助初学者和初级IT专业人员建立并验证在信息通信技术(ICT&#xf…

【一起学Rust | Tauri2.0框架】深入浅出 Tauri 2.0 应用调试:从新手到专家的蜕变

前言 Tauri 是一款备受瞩目的跨平台桌面应用开发框架,它允许开发者使用 Web 技术栈(HTML、CSS、JavaScript)构建高性能、安全的原生应用。Tauri 2.0 的发布带来了诸多令人兴奋的新特性和改进,进一步提升了开发体验和应用性能。然…

23种设计模式-创建型模式-单例

文章目录 简介问题1. 确保一个类只有一个实例2. 为该实例提供全局访问点 解决方案示例重构前:重构后: 拓展volatile 在单例模式中的双重作用 总结 简介 单例是一种创建型设计模式,它可以确保一个类只有一个实例,同时为该实例提供…

webscoket爬虫之某旺(1)分析篇

文章仅供学习与交流!严禁用于任何商业与非法用途!否则由此产生的一切后果均与作者无关!! 什么是websocket爬虫 WebSocket爬虫是一种利用WebSocket协议进行数据抓取的工具或程序。WebSocket是一种在单个TCP连接上进行全双工通信的协议,常用于实时应用程序,如聊天应用、在…

Qt在模块依靠情况下资源文件名称和资源名称的使用限制

概述 在Qt中使用添加资源文件的时候,对于资源文件名称的定义,往往是较为随意的。 但是当涉及到Qt库依赖的时候,则可能需要遵守一定的规则,否则可能出现文件找不到或者错误加载的问题。 环境 环境名称Qt 版本系统版本LinuxQt 5.…

python 游戏开发cocos2d库安装与使用

Cocos2d-x 是一个广泛使用的开源游戏开发框架,支持多种编程语言,包括 Python。对于 Python 开发者来说,通常使用的是 Cocos2d-py 或者更现代的 Cocos2d-x 的 Python 绑定版本。这里我将指导你如何安装和开始使用 Cocos2d-py。 安装步骤 安装…

分布式爬虫框架Scrapy-Redis实战指南

引言 在当今数字化的时代背景下,互联网技术的蓬勃兴起极大地改变了旅游酒店业的运营模式与市场格局。作为旅游产业链中的关键一环,酒店业的兴衰与互联网技术的应用程度紧密相连。分布式爬虫技术,尤其是基于 Scrapy 框架的 Scrapy-Redis 扩展…

Redis解决缓存击穿问题——两种方法

目录 引言 解决办法 互斥锁(强一致,性能差) 逻辑过期(高可用,性能优) 设计逻辑过期时间 引言 缓存击穿:给某一个key设置了过期时间,当key过期的时候,恰好这个时间点对…