科研学习|论文解读——OceanGPT:用于海洋科学任务的大型语言模型

news/2024/9/18 15:27:59/ 标签: 学习, 语言模型, 人工智能, OceanGPT, 智能体

摘要

海洋覆盖我们星球表面70%以上,对于理解生命的丰富储备和生物多样性至关重要。鉴于海洋在调节全球气候和支持经济中的关键作用,海洋科学研究具有重大意义。最近,大型语言模型(LLMs)的进步改变了科学的范式。尽管在其他领域取得了成功,但现有的LLMs在满足海洋学家等领域专家的需求方面往往不足,LLMs在海洋科学方面的潜力尚未被充分探索。内在原因包括海洋数据的庞大和复杂性,以及对更高粒度和知识丰富度需求。为了缓解这些问题,我们引入了OCEANGPT,这是海洋领域的第一个大型语言模型,它在各种海洋科学任务中表现出专家级的能力。我们还提出了DOINSTRUCT,这是一个新颖的框架,通过多代理合作自动获取大量海洋领域指令数据,生成指令。此外,我们构建了第一个海洋学基准测试OCEANBENCH以评估LLMs在海洋领域任务中的能力。实验证明,OCEANGPT不仅在海洋科学任务中显示出更高水平的知识专长,在海洋技术方面也体现出智能化能力。

一、引言

•  海洋科学深入研究覆盖地球表面70%以上的海洋,不仅对于理解丰富的生命和生物多样性至关重要,而且在调节全球气候和支持经济方面也起到了关键作用。

•  最近,语言模型医学( Moor et al. ,2023) 、分子科学 (Fang et al. ,2023) 、蛋白质科学( Lin et al. , 2023)和地球科学(Deng et al. ,2023)等科学领域得到应用然而大型语言模型在海洋科学中的潜力尚未得到充分开发

•  目前LLMs仍然不能完全满足海洋学家的特定需求。这种不足主要是由于

(1)海洋数据的海量和复杂海洋数据既能提高对海洋的理解也是一个重大的障碍

(2)对知识的粒度和丰富度要求更高。请注意 ,研究人员面临的数据需求正变得越来越复杂和多样化。海洋科学涵盖了各种领域和学科每个领域和学科都有其独特的数据属性和模式

•  为此,引入了OCEANGPT,海洋领域的第一个LLM

•  构造DOINSTRUCT ,这是一种高效的海洋科学指令生成框架 , 它利用了多代理协作( multi-agent collaboration)。每个代理都被视为特定领域(科学和研究、资源和开发、生态和环境等)的专家 ,并负责生成相应的数据。

创建OCEANBENCH 基准来评估海洋科学任务的能力。

通过广泛的实验 ,OCEANGPT 在各种海洋科学任务中显示出优势。 OCEANGPT 不仅展示了更高水平的知识专长 ,而且还体现出初步智能能力。

二、相关工作

•  语言模型

语言模型发展迅速,取得了一系列突破 (Brown et al., 2020; Chowdhery et al., 2022;Touvron et al., 2023a,b)

检索增强生成(RAG)整合来自外部数据库的知识 (Gao et al., 2023; Lewis et al., 2020;Schick et al., 2023; Khandelwal et al., 2020)

训练了一种全新的海洋科学大语言模型,并通过多智能体协作引入了有效的领域指令生成框架

•  科学大语言模型

LLMS在医疗Singhal et al.(2022);Moor et al. (2023)、生物医学(Luo et al.,2022); (Theodoris et al.,2023)、地球科学(Deng et al.,2023方面的工作。

与以往工作不同,我们设计了第一个用于海洋科学任务的大型语言模型,并探索了其在海洋研究中的潜力

三、OceanGPT

3.1 预训练阶段:

•  从开放获取文献中收集了 67,633 份文献的原始语料库。选择近年来的出版物,以确保包含最新的研究成果;选择来自不同来源的文章 ,以确保涵盖各种研究观点和方法。涵盖了海洋科学的各个方面 ,如海洋物理学、海洋化学、海洋生物学、地质学、水文学等

•  删除特殊字符、表情符号和乱码、删除重复数据,这有助于降低预训练期间过度拟合的风险 ,并增强其泛化能力。

3.2 域指令数据生成——海洋主题定义

•  海洋科学语料库包含多个领域和主题 ,每个主题都有其独特的数据特征和模式。为了有效地模拟和获取这些数据 ,我们提出了 一种领域指令生成框架DOINSTRUCT 通过多代理合作获取海洋指令。每个代理都被视为特定领域(主题)的专家 ,并负责生成相应的数据。 它不仅保证了数据的专业性和准确性 ,而且允许并行高效地生成大量数据。

•  我们根据海洋学专家的专业知识 ,将海洋科学中的数据手动分类为五个主要的海洋主题:科学和研究、资源和开发、生态与环境、技术和工程、生活和文化等

3.2 域指令数据生成——作为领域(海洋)专家的代理

•  我们使用代理作为每个海洋主题的领域专家 ,并使他们通过协作快速扩展指令。我们收集种子指令数据 ,并使用多个代理作为专家 ,提出

三种策略

•  为了构建种子数据集雇佣了数十名具有丰富海洋科学背景的注释者为每个主题手动编写一些具有代表性的例子。

•  通过LLMs模仿现有数据来生成大量相似的样本。所有样本最终都由注释者手动检查

•  最终的种子指令数据 集包括 5 个主要类别、 500 多个子类别和总共10,000 多个数据样本

•  3-1 进化数据合成代理代理采用两种协作策略:一是补充和扩展种子样本的背景知识,二是细化分析以增强和完善种子数据所蕴含的知识

3-2 微调文献阅读代理:先对大型语言模型进行微调,开发专门用于文献抽取的智能模型,使代理能够从浩如烟海的海洋文献中提取出高质量的句子

3-3 质量保证审核代理:预定义与海洋科学相关的特定句法和语义规则,通过提示过滤数据来构建该代理

 四、对海洋任务进行测试

•  训练过程:使用6个 A800 Nvidia GPU对基于 LLaMA-2 (Touvron et al. , 2023b)的OCEANGPT 进行了为期7天的预训练。

•  OCEANBENCH:为了评估LLM的能力而设计,共包括 15 项与海洋相关的任务,例如问答、提取和描述。

自动评估:利用 GPT-4 作为评估器,LLMs它们对响应的位置很敏感,为了平衡位置偏差,交换响应的顺序,结果是两个提示的测试结果之和。

人工评估:聘请了 5 名具有海洋科学背景的学生

作为人类注释员。对于每个评估设置,都采样200

 个示例,评估者被要求对他们更偏好的输出进行排名。

五、结果

性能结果

 OceanGPT在海洋科学中的应用

OCEANGPT在描述放射性核素研究的内容时表现出更高水平的知识专长。其文字内容不仅结构清晰、组织有序,而且涵盖了放射性核素研究的各个环节,从实验设计到数据分析,再到风险评估和处置指南。

六、结论与局限

 结论:介绍了第一个海洋学预训练语言模型OCEANGPT我们提出了一种领域构建框架DOINSTRUCT,该框架通过多智能体协作构建海洋指令数据集。我们设计的框架中的每个代理都被视为特定主题的专家,并负责生成相应的数据。我们生成的数据集由各种指令组成,OCEANGPT不仅在海洋科学任务中表现出更高水平的知识专长,而且在海洋工程中获得了初步的体现智能能力。

•  局限:

数据分布中的偏差:预训练数据的偏见、指令数据的偏见可能导致模型强化现有的偏见

LLM的幻觉:LLMs偶尔生成偏离用户输入的内容、与先前生成的上下文相矛盾或与既定世界知识冲突的情况。


http://www.ppmy.cn/news/1520506.html

相关文章

Linux下递归设置目标目录及其子目录和文件的权限

〇、背景 本文旨在简单介绍一个在Linux环境下批量修改目录及其子目录和文件的权限的方法。 一、实现 首先新建一个shell脚本文件,使用指令$ vi chmod.sh,然后在文件中输入下述代码。 #!/bin/bashOFFSET_INDEX" " DIR_MODE755 FILE_MODE664…

Oracle---PAG程序全局区的组成:堆栈区、会话区、游标区、排序区

文章目录 PGA程序全局区PGA主要内容1、排序区(SORT AREA)**为什么给排序设置合理的排序区大小** 2、会话区(USER SESSON DATA)3、堆栈区保存变量信息(STACK SPACE)4、游标区 (CURSOR STATE) PGA程序全局区 程序全局区或进程全局区…

AN7536PT时钟电路

目录 1 时钟电路概述2 时钟晶振电路2.1 需求分析2.2 晶振选型(Datasheet表5-7解读)2.3 设计晶振电路(表4-1、图5-4) 1 时钟电路概述 时钟电路是一种用于产生稳定、周期性脉冲信号的电子电路。它通常由晶体振荡器和相关逻辑电路组…

Luminar Neo for Mac智能图像处理软件【操作简单,轻松上手】

Mac分享吧 文章目录 效果一、下载软件二、开始安装1、双击运行软件,将其从左侧拖入右侧文件夹中,等待安装完毕2、应用程序显示软件图标,表示安装成功 三、运行测试安装完成!!! 效果 一、下载软件 下载软件…

Hackme靶场渗透攻略

步骤一,注册登录进去 步骤二,点击search 我们发现有很多书 步骤三,搜索一本书抓包发放到重放器 步骤四,数据改为1*,复制数据包到1.txt,然后打开sqlmap 步骤五,sqlmap查看当前数据库 python s…

阿尔茨海默病症识别+图像识别Python+人工智能+深度学习+TensorFlow+机器学习+卷积神经网络算法

一、介绍 阿尔茨海默病症识别。使用Python作为主要编程语言进行开发,基于深度学习等技术使用TensorFlow搭建ResNet50卷积神经网络算法,通过对病症图片4种数据集进行训练[‘轻度痴呆’, ‘中度痴呆’, ‘非痴呆’, ‘非常轻微的痴呆’],最终得…

TeeChart助力科研软件:高效实现数据可视化

在当今的科学研究中,数据可视化已经成为理解和传播复杂信息的关键工具。尤其是在物理研究领域,科学家们经常需要处理大量的数据,并通过可视化将这些数据转化为更易理解的形式。TeeChart作为一个强大且灵活的图形展示工具,能够帮助…

前端按钮通过浏览器下载附件

html <a click"downloadAttach(record.memoryAddress)">下载附件</a> js downloadAttach(url){var fileUrl window._CONFIG[staticDomainURL] url;window.open(fileUrl); } 配置文件 window._CONFIG[staticDomainURL] http://127.0.0.1:3000/xxx…

Spring Cloud Gateway的使用

Spring Cloud Gateway的使用 1. Spring Cloud Gateway原理2. Spring Boot项目中集成Spring Cloud Gateway2.1 创建项目与添加依赖2.2 配置网关 3. 高级功能与实践**3.1 配置过滤器****3.2 分组路由** 4. 监控与故障处理5. 部署与持续集成 在微服务架构中&#xff0c;服务发现、…

计算机网络(一) —— 网络基础入门

目录 一&#xff0c;关于网络 二&#xff0c;协议 2.1 协议是什么&#xff0c;有什么用&#xff1f; 2.2 协议标准谁定的&#xff1f; 2.3 协议分层 2.4 OSI 七层模型 2.5 TCP/IP 四层模型 三&#xff0c;网络传输基本流程 3.1 局域网中两台主机通信* 3.2 报文的封装与…

uniapp网站和微信小程序 添加 百度统计

提示&#xff1a;文章写完后&#xff0c;目录可以自动生成&#xff0c;如何生成可参考右边的帮助文档 文章目录 一、首先&#xff0c;需要在百度统计平台注册一个账户或登录现有的账户二、新建站点(应用)、添加代码三、代码获取与安装1.在官方网站 新增应用&#xff0c;根据官方…

kernel底层的蓝牙开发流程

kernel底层的蓝牙开发流程是一个复杂且细致的过程&#xff0c;它涉及到从内核配置、驱动编写、工具编译到最终的设备调试等多个环节。以下是一个详细的蓝牙开发流程&#xff0c;旨在为读者提供一个全面的视角。 一、前期准备 1. 确定开发环境 首先&#xff0c;需要确定开发所…

复数遍历4联通区域

怎么理解虚数和复数&#xff1f; - 知乎

python-禁止抽烟

题目描述 小理的朋友有 n 根烟&#xff0c;他每吸完一根烟就把烟蒂保存起来&#xff0c;k&#xff08; k>1&#xff09;个烟蒂可以换一个新的烟&#xff0c;那么小理的朋友最终能吸到多少根烟呢&#xff1f; 与某些脑筋急转弯不同的是&#xff0c;小理的朋友并不能从异次元借…

OpenHarmony 实战开发——一文总结ACE代码框架

一、前言 ACE_Engine框架是OpenAtom OpenHarmony&#xff08;简称“OpenHarmony”&#xff09;的UI开发框架&#xff0c;为开发者提供在进行应用UI开发时所必需的各种组件&#xff0c;以及定义这些组件的属性、样式、事件及方法&#xff0c;通过这些组件可以方便进行OpenHarmo…

在 Vue 中实现跨项目数据传递

在 Vue 中实现跨项目数据传递可以通过以下几种方法&#xff1a; 一、使用本地存储&#xff08;Local Storage&#xff09; 存储数据 在一个项目中&#xff0c;可以使用localStorage.setItem()方法将数据存储到本地存储中。例如&#xff1a;localStorage.setItem(sharedData, J…

CentOS全面停服,国产化提速,央国企信创即时通讯/协同门户如何选型?

01. CentOS停服带来安全新风险&#xff0c; 国产操作系统迎来新的发展机遇 2024年6月30日&#xff0c;CentOS 7版本全面停服&#xff0c;于2014年发布的开源类服务器操作系统——CentOS全系列版本生命周期画上了句号。国内大量基于CentOS开发和适配的服务器及平台&#xff0c…

RESTful基本要求

文章目录 RESTful -Representational State Transfer1 什么是RESTful2 RESTful的特征3 如何设计符合RESTful 特征的API RESTful -Representational State Transfer 1 什么是RESTful 资源 &#xff08;Resources&#xff09; 网络上的一个实体&#xff0c;或者说是网络上的一个…

《Rust避坑入门记》第2章:解决多线程并发数据竞争的不可变性

从第1章所讨论的出现数据竞争问题的多线程并发剧院订票系统的代码能够看出&#xff0c;虽然可变性能够方便地随时修改值&#xff0c;但滥用可变性&#xff0c;会在多线程并发编程时&#xff0c;带来数据竞争的难题。 共享可变状态所带来的多线程并发时的数据竞争难题&#xff…

windows11交叉编译ffmpeg的android版本库

目录 1、工具准备 &#xff08;1&#xff09;MSYS2 &#xff08;2&#xff09;NDK&#xff08;也可直接用android studio安装的&#xff09; &#xff08;3&#xff09;ffmpeg源码 2、环境配置 3、创建编译脚本 4、编译 曾经看到一个博客说&#xff0c;不要用windows编译…