MindAgent:基于大型语言模型的多智能体协作基础设施

server/2025/1/23 0:13:04/

2023-09-18 ,加州大学洛杉矶分校(UCLA)、微软研究院、斯坦福大学等机构共同创建的新型基础设施,目的在评估大型语言模型在游戏互动中的规划和协调能力。MindAgent通过CuisineWorld这一新的游戏场景和相关基准,调度多智能体协作效率,并监督多个智能体同时玩游戏。

一、研究背景

大型语言模型(LLMs)在处理复杂任务方面展现出巨大潜力,从数学推理到专业领域的问答,LLMs的应用范围不断扩大。然而,对于LLMs在多智能体系统中的规划能力,尤其是与人类玩家协作完成任务的能力,研究仍相对不足。

目前遇到困难和挑战:

1、计算成本高:多智能体规划需要同时控制多个智能体,避免冲突并协调完成共享目标,这对计算资源要求极高。

2、上下文长度限制:LLMs在处理多智能体任务时,受限于上下文长度,难以处理复杂的任务序列。

3、非最优计划:尽管LLMs可以通过上下文学习来改进计划,但生成的计划可能并非最优,需要进一步优化。

数据集地址: CuisineWorld

二、让我们一起来看一下CuisineWorld

CuisineWorld是一个虚拟厨房环境中的多智能体调度和协调游戏,用于测试LLMs的多智能体规划能力。

CuisineWorld构建:

1、从社区贡献的维基百科中爬取规则和食谱,简化并修改后形成CuisineWorld的基本版本。

2、包含10种地点(服务台、存储和8种不同的烹饪工具)、27种食材和33种独特的菜品。

CuisineWorld特点:

  • 多任务:包含多种不同的任务,从简单的生鱼片制作到复杂的意大利面烹饪,任务难度逐渐增加。

  • 多智能体:支持多达4个智能体同时协作。需要协调完成尽可能多的菜品订单。

  • 动态任务生成:任务会根据游戏进度动态生成,增加了游戏的挑战性和多样性。

CuisineWorld通过文本界面与LLMs交互,提供游戏状态描述和可能的行动命令。LLMs根据这些信息做出决策,调度智能体完成任务。

基准测试:

  • 引入了新的自动评估指标——协作得分(CoS),用于计算协作效率。

  • 在不同的任务间隔条件下,评估智能体完成任务的能力,CoS得分越高,表示协作效率越高。

MINDAGENT 能够在多智能体系统和人机协作的基础设施中,实现跨越不同领域的复杂任务规划。

CUISINEWORLD 与其他相关基准之间的比较。

CUISINEWORLD 中的行动空间

关于所涉及工具和食材数量、烹饪步骤以及食谱中最大混合量的菜肴分布情况

MINDAGENT 架构的概述:

1、规划技能与工具使用:游戏环境需要多样化的规划技能和工具运用来完成任务。它会发出相关的游戏信息。此模块还会将相关游戏数据转换为结构化文本格式,以便大语言模型(LLMs)进行处理。

2、大语言模型(LLM):我们基础设施的核心组件,负责做出决策,它是多智能体系统的调度器。

3、记忆历史:一种存储实用工具,用于存储相关信息。

4、行动模块:从文本输入中提取行动,并将其转换为特定领域语言。验证特定领域语言(DSLs),确保其在执行时不会引发错误。

展示CuisineWorld中的一个多智能体协作示例,三个智能体正在一起准备混合果汁。

三、让我们一起来看一下CuisineWorld应用场景

比如:有一所职业学校,开设了一门烹饪技能与团队协作的培训课程,旨在帮助学生掌握烹饪技巧的同时,提升他们在团队中的协作能力。学校引入了CuisineWorld这一虚拟厨房游戏作为教学工具。

课程设置

课程时长:共12周,每周2次课,每次课2小时。

学生分组:将学生分成4人一组,每组配备一台电脑,用于运行CuisineWorld游戏。

教学目标:学生能够在团队中高效协作,完成各种烹饪任务,同时掌握基本的烹饪技巧和食谱知识。

课程内容

1、前3周:基础烹饪知识学习

教师通过AR课程引导,向学生介绍厨房的基本设备、工具和食材。

学生在PC端进行实训教学,学习简单的烹饪技巧,如切菜、煮沸等。

在CuisineWorld游戏中,学生独自完成简单的烹饪任务,如制作生鱼片,熟悉游戏界面和操作方式。

2、中间6周:团队协作与任务规划

每组学生开始在CuisineWorld中协作完成更复杂的烹饪任务,如制作意大利面。

教师引导学生讨论如何分配任务,例如谁负责切菜,谁负责烹饪,谁负责摆盘。

学生需要根据游戏中的任务订单,合理安排烹饪步骤和时间,确保在规定时间内完成菜品制作。

教师在旁观察,记录学生在团队协作中的表现,如沟通能力、任务分配合理性等。

3、最后3周:综合实践与评估

学生在CuisineWorld中挑战高级烹饪任务,如制作多道菜的套餐。

教师组织学生进行小组间的烹饪比赛,鼓励学生在比赛中发挥团队协作精神,提高烹饪效率和菜品质量。

通过CuisineWorld的自动评估系统,计算每个小组的协作得分(CoS),并结合教师的观察记录,对学生的团队协作能力和烹饪技能进行综合评估。

CuisineWorld作为一个教育工具不仅提供了一个虚拟的实践平台,还能够通过自动评估系统为教师提供教学反馈,帮助教师更好地了解学生的学习情况,从而优化教学方法。

更多免费的数据集,请打开:遇见数据集

遇见数据集-让每个数据集都被发现,让每一次遇见都有价值。遇见数据集,领先的千万级数据集搜索引擎,实时追踪全球数据集,助力把握数据要素市场。icon-default.png?t=O83Ahttps://www.selectdataset.com/


http://www.ppmy.cn/server/160597.html

相关文章

在 vscode + cmake + GNU 工具链的基础上配置 JLINK

安装 JLINK JLINK 官网链接 下载安装后找到安装路径下的可执行文件 将此路径添加到环境变量的 Path 中。 创建 JFlash 项目 打开 JFlash,选择新建项目 选择单片机型号 在弹出的窗口中搜索单片机 其他参数根据实际情况填写 新建完成: 接下来设置…

STM32 FreeRTOS中断管理

目录 FreeRTOS的中断管理 1、STM32中断优先级管理 2、FreeRTOS任务优先级管理 3、寄存器和内存映射寄存器 4、BASEPRI寄存器 5、FreeRTOS与STM32中断管理结合使用 vPortRaiseBASEPRI vPortSetBASEPRI 6、FromISR后缀 7、在中断服务函数中调用FreeRTOS的API函数需注意 F…

电脑如何访问手机文件?

手机和电脑已经深深融入了我们的日常生活,无时无刻不在为我们提供服务。除了电脑远程操控电脑外,我们还可以在电脑上轻松地访问Android或iPhone手机上的文件。那么,如何使用电脑远程访问手机上的文件呢? 如何使用电脑访问手机文件…

Android 11适配全攻略:从理论到实践

随着Google正式发布Android 11,开发者们迎来了新的挑战和机遇。Android 11不仅带来了全新的用户体验和功能提升,还要求开发者们对应用进行相应的适配,以确保应用的兼容性和稳定性。本文将从理论到实践,全面解析Android 11的适配攻…

【Java】阿里云OSS上传、删除文件

阿里云OSS上传、删除文件 编写AliOssConfig&#xff1a; import lombok.Data;/*** <p>DESC: </p>* <p>VERSION:1.0.0</p>*/ Data public class AliOssConfig {private String endpoint;private String accessKey;private String accessSecret;private…

开发常用工具

在项目开发中&#xff0c;工具的使用起到了至关重要的作用&#xff0c;正所谓工欲善其事&#xff0c;必先利其器&#xff0c;掌握一些实用的开发工具能够使我们的开发效率事半功倍。 那么我们应该掌握哪些开发工具的使用方法呢&#xff1f;其实一路走来&#xff0c;我们已经介…

【Go】Go Gin框架初识(一)

1. 什么是Gin框架 Gin框架&#xff1a;是一个由 Golang 语言开发的 web 框架&#xff0c;能够极大提高开发 web 应用的效率&#xff01; 1.1 什么是web框架 web框架体系图&#xff08;前后端不分离&#xff09;如下图所示&#xff1a; 从上图中我们可以发现一个Web框架最重要…

Java-抽象方法

抽象方法&#xff1a; ●抽象方法&#xff1a;将共性的行为&#xff08;方法&#xff09;抽取到父类之后。由于每一个子类执行的内容是不一样&#xff0c;所以&#xff0c;在父类中不能确定具体的方法体。该方法就可以定义为抽象方法。 ●抽象类&#xff1a;如果一个类中存在…