评估大语言模型在药物基因组学问答任务中的表现:PGxQA

news/2024/12/26 21:46:17/

​这篇文献主要介绍了一个名为PGxQA的资源,用于评估大语言模型(LLM)在药物基因组学问答任务中的表现。

研究背景

药物基因组学(Pharmacogenomics, PGx)是精准医学中最有前景的领域之一,通过基因指导的治疗来提高药物的安全性和疗效。然而,由于缺乏教育和意识,PGx在临床中的应用进展缓慢。大语言模型(LLM)如GPT-4的引入,为开发能够提供及时信息的医疗聊天机器人提供了可能性。

研究目标

研究的主要目标是开发和评估一个名为PGxQA的资源,用于评估LLM在回答PGx相关问题时的表现。该资源旨在帮助临床医生、患者和研究人员更好地理解和利用PGx知识。

方法

自动问题生成:使用Python脚本从CPIC数据库中提取相关信息,并生成问题-答案对。

LLM查询:使用Python脚本将问题发送到本地或远程的LLM服务器,并收集LLM的回答。

手动问题生成:从实际临床和研究环境中收集问题,并手动整理成问题-答案对。

自动评分:开发了一系列自动评分函数来评估LLM的表现,包括数值评分、信息检索评分和文本相似度评分。

人工评审:招募PGx专家对LLM的回答进行人工评审,评估其准确性、完整性和安全性。

结果

自动评分结果:GPT-4在大多数评分指标上表现优异,特别是在数值回答和信息检索任务中表现出色。

人工评审结果:GPT-4的回答在准确性、完整性和安全性方面得分较高,但在某些问题上仍存在错误或危险的回答。

讨论

研究指出,LLM在处理PGx查询时存在一些局限性,如对数值回答的准确性较差、容易生成虚假信息等。为了解决这些问题,提出了几种改进方法,包括提示工程、微调和检索增强生成(RAG)。

结论

PGxQA为评估LLM在PGx任务中的表现提供了一个框架,并展示了GPT-4在这一领域的潜力。未来的研究将继续改进这一框架,以确保LLM在临床环境中的应用更加安全和有效。

欢迎关注“赛文AI药学”!

赛文AI药学,致力于探索人工智能在药学场景中的创新与应用,聚焦药师的AI赋能与专业素养提升。我们提供前沿的AI技术动态、实用的药学场景案例分享以及个性化学习资源,助力药师在智能化时代实现价值跃升。


http://www.ppmy.cn/news/1558358.html

相关文章

安卓帧率获取

背景 性能优化,经常用到一些指标,诸如帧率、功耗等。对于普通app来讲, 之前一直使用gfxinfo指令获取丢帧率。但是这个指令无法获取游戏的帧率,查阅资料,发现SurfaceFlinger可以获取游戏帧率。 帧率获取原理 获取当前f…

视频的音乐怎么提取为MP3格式?

MP3是一种广泛使用的音频压缩格式,以其高效的压缩率和良好的音质表现,成为了数字音频领域中的佼佼者,广泛应用于音乐存储、传输和播放。在日常生活中,我们经常遇到需要从视频中提取音频并将其转换为MP3格式的情况。视频的音乐怎么…

Rust之抽空学习系列(五)—— 所有权(上)

Rust之抽空学习系列(五)—— 所有权(上) 1、什么是所有权 所有权是确保Rust程序安全的一种机制 安全则是指程序中没有未定义的行为未定义的行为是指在执行一段代码时,结果不可预测且未被编程语言指定的情况Rust的基…

ELK系列-(六)Redis也能作为消息队列?(下)

一、前文回顾 🔍 在前面的ELK系列中,我们已经搭建了ELK的核心组件,包括: ELK系列-(一)Docker部署ELK核心组件ELK系列-(二)LogStash数据处理的瑞士军刀ELK系列-(三&…

威尔克斯(Wilks)分布

内容来源 应用多元统计分析 北京大学出版社 高惠璇编著 威尔克斯 Λ \Lambda Λ 分布 回顾一元统计中的 F F F 分布 设 ξ ∼ χ 2 ( m ) , η ∼ χ 2 ( n ) \xi\sim\chi^2(m),\eta\sim\chi^2(n) ξ∼χ2(m),η∼χ2(n),且相互独立,则 F ξ / m η…

Pikachu 漏洞练习平台 XXE漏洞学习记录

懒得自己搭建的可以直接FOFA找别人的靶场玩 FOFA "Pikachu 漏洞练习平台" 开始 随便输入个包含命名实体&#xff08;内部实体&#xff09;的xml数据&#xff08;以下代码中xxe是命名实体的实体名称&#xff09;&#xff1a; <?xml version"1.0"?>…

明厨亮灶系统

校园食堂明厨亮灶AI分析系统通过yolov5网络模型技术&#xff0c;校园食堂明厨亮灶监控分析系统针对校园餐厅后厨不按要求戴口罩、不穿厨师帽、陌生人员进入后厨、厨师不穿厨师服、上班时间玩手机、老鼠识别等行为校园食堂明厨亮灶监控分析系统自动识别抓拍告警。Yolo算法&#…

React第十八节 useEffect 用法使用技巧注意事项详解

1、概述 useEffect 是React中一个用于 将组件与外部系统同步的 Hook&#xff1b;在函数式组件中处理副作用函数的 Hook&#xff0c;用于替代类式组件中的生命周期函数&#xff1b; 可以在副作用函数中 实现以下操作&#xff1a; a、请求接口&#xff0c;获取后台提供数据 b、操…