上下文微调(Contextual Fine-Tuning, CFT)提高大型语言模型(LLMs)在特定领域的学习和推理能力

ops/2025/3/18 21:18:39/

大型语言模型LLMs)在开放领域任务中表现出色,但在快速演变的专业领域(如医学、金融)中面临挑战:

  • 知识更新难题:传统指令微调(Instruction Fine-Tuning, IFT)依赖显式指令,难以适应动态知识。
  • 灾难性遗忘:持续预训练(Continued Pretraining, CPT)可能导致模型遗忘已有知识。
  • 推理能力限制:模型难以通过纯文本学习建立领域内深层语义关联。

本文提出上下文微调(Contextual Fine-Tuning, CFT),通过模拟人类认知策略的提示语,结合上下文学习和微调的方法,通过简单的领域自适应提示显著提高了LLMs在新领域的知识获取和开放式推理能力。实验结果表明,CFT在医疗和金融领域的基准测试中均优于传统的持续预训练和指令微调方法。
CFT在处理领域特定数据时的具体优势:

提高学习效率:CFT通过上下文提示提供额外的语义信息,帮助模型更好地理解和学习新领域的知识,从而提高了学习效率。实验表明,CFT模型在训练过程中损失更低,收敛速度更快。

增强模型性能:CFT在多个医疗和财务基准测试中均表现出优于CPT和IFT的性能。例如,在医疗领域的多选题数据集中,CFT的平均准确率提高了4.89%。

减少遗忘:CFT通过结合上下文学习和微调,能够在学习新领域知识的同时保留已有的知识,减少了知识遗忘的现象。这与传统的持续预训练方法相比具有显著优势。

适用性广泛:CFT不仅适用于生物医学领域,还可以扩展到其他领域,如金融、法律等,显示出其广泛的适用性和灵活性。


方法创新:上下文微调(CFT)

核心思想

  • 认知策略驱动:设计受教育学理论启发的上下文提示(如“关注核心概念”“批判性分析”),引导模型学习新知识时的语义理解。
  • 梯度对齐:通过提示语控制模型优化方向,减少无效参数更新,缓解遗忘问题。

技术实现

  1. 输入构造
    在原始输入序列前添加上下文提示语,例如:
    "Critically analyze the upcoming information. Look for underlying assumptions..."
    形成新输入:[提示语] + [原始文本]

通过指导GPT-4o-mini根据每个训练批次的内容创建提示来自动生成上下文提示。
具体来说,我们使用以下指令模板:在这里插入图片描述在此模板中,{{ INSTRUCTION }}被替换为从以下五种不同指令中抽取的一个样本指令,以生成多种提示:

  1. “给定以下文本,生成一个鼓励读者关注所呈现的主要观点和主题的上下文提示。该上下文提示应简洁并帮助读者深入参与内容。”
  2. “分析下面的文本,并创建一个引导读者批判性地思考内容的上下文提示,质疑假设并评估论点。”提示应鼓励读者考虑文中提出的不同观点。
  3. “阅读文本,并生成一个情境提示,鼓励读者思考信息如何与他们现有的知识或经验相联系。提示应促进新见解与先前理解的整合。”
  4. “阅读以下文本,并创建一个情境提示,引导读者用自己的话总结主要观点。提示应鼓励综合信息以便更好地理解。”
  5. “根据下面的文本,制定一个情境提示,引导读者比较和对比所介绍的概念与相关话题或先前知识。提示应帮助识别相似之处和差异。”

同样,{{ TEXT }} 会被每批的文本替换。
以下是适用于 OpenMedText 的生成的上下文提示示例:

  1. “对这项关于 PCR 技术和 LeHV-5 检测的研究中的方法和发现进行批判性评估。实验设计的基础假设是什么?是否有其他方法或观点可以挑战或补充所提出的论点?考虑这些方法对更广泛的兽医医学科学研究和诊断的影响。”
  2. “思考钾离子通道与癌症治疗中的化疗耐药性之间的复杂关系。所呈现的机制与你之前对癌细胞生物学和耐药性的了解有何比较?确定不同类型癌症中 K+通道的作用的异同及其对治疗策略的影响。考虑将这种理解纳入临床实践的潜在途径。”
  3. “从多个角度考虑学校早餐参与情况的发现及其对学生健康的影响。教育工作者、政策制定者、学校管理人员和医疗保健专业人员可能如何不同地解释这些结果?思考每个利益相关者如何在其各自的角色中使用这些信息来改善学生健康和教育成果。”
  1. 训练目标
    损失函数定义为:
    L C F T ( θ ) = − E x , c ∑ k = 1 n log ⁡ P θ ( x k ∣ c , x < k ) \mathcal{L}_{CFT}(\theta) = -\mathbb{E}_{x,c} \sum_{k=1}^n \log P_\theta(x_k | c, x_{<k}) LCFT(θ)=Ex,ck=1nlogPθ(xkc,x


http://www.ppmy.cn/ops/166869.html

相关文章

WPF未来展望:紧跟技术发展趋势,探索新的可能性

WPF未来展望&#xff1a;紧跟技术发展趋势&#xff0c;探索新的可能性 一、前言二、WPF 与.NET 技术的融合发展2.1 拥抱.NET Core2.2 利用.NET 5 及后续版本的新特性 三、WPF 在新兴技术领域的应用拓展3.1 与云计算的结合3.2 融入物联网生态 四、WPF 在用户体验和设计方面的创新…

密码学研究热点

一、后量子密码学 抗量子算法研究 开发能够抵抗量子计算机攻击的加密算法&#xff0c;如基于格的密码学&#xff08;LWE、NTRU&#xff09;、基于同源的密码学&#xff08;Isogeny&#xff09;和基于编码理论的密码学。 标准化进程 NIST等机构正推动后量子密码算法的标准化…

审批工作流系统xFlow

WorkFlow-审批流程系统 该项目为完全开源免费项目 可用于学习或搭建初始化审批流程系统 希望有用的小伙伴记得点个免费的star gitee仓库地址 仿钉钉飞书工作审批流系统 介绍 前端技术栈: vue3 ts vite arcodesign eslint 后端技术栈:springbootspring mvc mybatis mavenmysq…

android.widget包介绍

android.widget 是 Android 开发中用于构建用户界面&#xff08;UI&#xff09;的核心包之一。它包含了大量的 UI 控件&#xff08;如按钮、文本框、列表等&#xff09;&#xff0c;这些控件通常被称为“小部件”&#xff08;Widget&#xff09;。android.widget 包中的类大多继…

windows协议不再续签,华为再无windows可用,将于四月发布鸿蒙PC

大家好&#xff0c;我是国货系创始人张云泽&#xff0c;最近不少小伙伴在后台问&#xff1a;“听说Windows协议要到期了&#xff1f;我的电脑会不会变砖&#xff1f;”还有人说&#xff1a;“华为笔记本以后用不了Windows了&#xff1f;鸿蒙系统能用吗&#xff1f;”今天咱们就…

todolist docker 小工具

参考链接 前排提示 没有中文&#xff0c;可使用浏览器 翻译 前提 安装docker安装docker-compose 下载仓库 git clone https://github.com/JordanKnott/taskcafe进行安装 cd taskcafe docker-compose -p taskcafe up -d服务启动后会监听在 3333 端口上&#xff0c;通过浏览器…

go数据结构笔记

常用数据结构 切片 定义int类型&#xff0c;大小为3 长度为10 切片的数据结构可以类比成ArrayList&#xff0c;具备动态扩容的数组 package mainimport "fmt"func main() {var numbers make([]int, 3, 10) //切片类型为int 长度为3 容量为10printSlice(numbers)…

MariaDB 10.6.21(安装后实际版本为10.6.19)

确保Mysql卸载干净&#xff01; 卸载自带的 MariaDB 查看版本&#xff1a;有则需要卸载。 rpm -qa|grep mariadb卸载&#xff1a;复制文件名&#xff0c;执行以下指令。 rpm -e --nodeps 文件名确认卸载&#xff1a; rpm -qa|grep mariadb 添加 MariaDB yum 仓库 首先在Cen…