MindAgent:基于大型语言模型的多智能体协作基础设施

ops/2025/1/19 14:25:40/

2023-09-18 ,加州大学洛杉矶分校(UCLA)、微软研究院、斯坦福大学等机构共同创建的新型基础设施,目的在评估大型语言模型在游戏互动中的规划和协调能力。MindAgent通过CuisineWorld这一新的游戏场景和相关基准,调度多智能体协作效率,并监督多个智能体同时玩游戏。

一、研究背景

大型语言模型(LLMs)在处理复杂任务方面展现出巨大潜力,从数学推理到专业领域的问答,LLMs的应用范围不断扩大。然而,对于LLMs在多智能体系统中的规划能力,尤其是与人类玩家协作完成任务的能力,研究仍相对不足。

目前遇到困难和挑战:

1、计算成本高:多智能体规划需要同时控制多个智能体,避免冲突并协调完成共享目标,这对计算资源要求极高。

2、上下文长度限制:LLMs在处理多智能体任务时,受限于上下文长度,难以处理复杂的任务序列。

3、非最优计划:尽管LLMs可以通过上下文学习来改进计划,但生成的计划可能并非最优,需要进一步优化。

数据集地址: CuisineWorld

二、让我们一起来看一下CuisineWorld

CuisineWorld是一个虚拟厨房环境中的多智能体调度和协调游戏,用于测试LLMs的多智能体规划能力。

CuisineWorld构建:

1、从社区贡献的维基百科中爬取规则和食谱,简化并修改后形成CuisineWorld的基本版本。

2、包含10种地点(服务台、存储和8种不同的烹饪工具)、27种食材和33种独特的菜品。

CuisineWorld特点:

  • 多任务:包含多种不同的任务,从简单的生鱼片制作到复杂的意大利面烹饪,任务难度逐渐增加。

  • 多智能体:支持多达4个智能体同时协作。需要协调完成尽可能多的菜品订单。

  • 动态任务生成:任务会根据游戏进度动态生成,增加了游戏的挑战性和多样性。

CuisineWorld通过文本界面与LLMs交互,提供游戏状态描述和可能的行动命令。LLMs根据这些信息做出决策,调度智能体完成任务。

基准测试:

  • 引入了新的自动评估指标——协作得分(CoS),用于计算协作效率。

  • 在不同的任务间隔条件下,评估智能体完成任务的能力,CoS得分越高,表示协作效率越高。

MINDAGENT 能够在多智能体系统和人机协作的基础设施中,实现跨越不同领域的复杂任务规划。

CUISINEWORLD 与其他相关基准之间的比较。

CUISINEWORLD 中的行动空间

关于所涉及工具和食材数量、烹饪步骤以及食谱中最大混合量的菜肴分布情况

MINDAGENT 架构的概述:

1、规划技能与工具使用:游戏环境需要多样化的规划技能和工具运用来完成任务。它会发出相关的游戏信息。此模块还会将相关游戏数据转换为结构化文本格式,以便大语言模型(LLMs)进行处理。

2、大语言模型(LLM):我们基础设施的核心组件,负责做出决策,它是多智能体系统的调度器。

3、记忆历史:一种存储实用工具,用于存储相关信息。

4、行动模块:从文本输入中提取行动,并将其转换为特定领域语言。验证特定领域语言(DSLs),确保其在执行时不会引发错误。

展示CuisineWorld中的一个多智能体协作示例,三个智能体正在一起准备混合果汁。

三、让我们一起来看一下CuisineWorld应用场景

比如:有一所职业学校,开设了一门烹饪技能与团队协作的培训课程,旨在帮助学生掌握烹饪技巧的同时,提升他们在团队中的协作能力。学校引入了CuisineWorld这一虚拟厨房游戏作为教学工具。

课程设置

课程时长:共12周,每周2次课,每次课2小时。

学生分组:将学生分成4人一组,每组配备一台电脑,用于运行CuisineWorld游戏。

教学目标:学生能够在团队中高效协作,完成各种烹饪任务,同时掌握基本的烹饪技巧和食谱知识。

课程内容

1、前3周:基础烹饪知识学习

教师通过AR课程引导,向学生介绍厨房的基本设备、工具和食材。

学生在PC端进行实训教学,学习简单的烹饪技巧,如切菜、煮沸等。

在CuisineWorld游戏中,学生独自完成简单的烹饪任务,如制作生鱼片,熟悉游戏界面和操作方式。

2、中间6周:团队协作与任务规划

每组学生开始在CuisineWorld中协作完成更复杂的烹饪任务,如制作意大利面。

教师引导学生讨论如何分配任务,例如谁负责切菜,谁负责烹饪,谁负责摆盘。

学生需要根据游戏中的任务订单,合理安排烹饪步骤和时间,确保在规定时间内完成菜品制作。

教师在旁观察,记录学生在团队协作中的表现,如沟通能力、任务分配合理性等。

3、最后3周:综合实践与评估

学生在CuisineWorld中挑战高级烹饪任务,如制作多道菜的套餐。

教师组织学生进行小组间的烹饪比赛,鼓励学生在比赛中发挥团队协作精神,提高烹饪效率和菜品质量。

通过CuisineWorld的自动评估系统,计算每个小组的协作得分(CoS),并结合教师的观察记录,对学生的团队协作能力和烹饪技能进行综合评估。

CuisineWorld作为一个教育工具不仅提供了一个虚拟的实践平台,还能够通过自动评估系统为教师提供教学反馈,帮助教师更好地了解学生的学习情况,从而优化教学方法。

更多免费的数据集,请打开:遇见数据集

遇见数据集-让每个数据集都被发现,让每一次遇见都有价值。遇见数据集,领先的千万级数据集搜索引擎,实时追踪全球数据集,助力把握数据要素市场。icon-default.png?t=O83Ahttps://www.selectdataset.com/


http://www.ppmy.cn/ops/151400.html

相关文章

Day09-后端Web实战——部门管理开发Logback日志技术

目录 部门管理开发1. 删除部门1.1 需求分析 1.2 思路分析1.2.1 思路说明1.2.1 简单参数接收 1.3 代码实现1.4 Mybatis中的#与$ 2. 新增部门2.1 需求分析2.2 思路分析2.2.1 思路说明2.2.2 json参数接收 2.3 代码实现 3. 修改部门3.1 查询回显3.1.1 需求分析3.1.2 思路分析3.1.2.…

分布式项目新选择:Dubbo搭建方案

在当今的数字化时代,构建高性能、可扩展的分布式系统已成为众多企业应对业务增长和技术挑战的关键。Dubbo,作为阿里巴巴开源的一款高性能、轻量级的Java RPC框架,为Java开发者提供了一套完善的分布式服务治理方案。本文将详细介绍如何使用Dub…

密码机服务器在云计算中的应用与挑战

随着云计算技术的迅猛发展和普及,密码机服务器作为一种高效、专业的数据安全解决方案,正在云计算领域中扮演着越来越重要的角色。本文将探讨密码机服务器在云计算中的应用及其面临的挑战。 云计算技术涉及大量的数据传输和存储,数据的安全性和…

如何将本地 Node.js 服务部署到宝塔面板:完整的部署指南

文章简介: 将本地开发的 Node.js 项目部署到线上服务器是开发者常见的工作流程之一。在这篇文章中,我将详细介绍如何将本地的 Node.js 服务通过宝塔面板(BT 面板)上线。宝塔面板是一个强大的服务器管理工具,具有简洁的…

Unity HybridCLR Settings热更设置

需要热更的程序集放到 热更新Assembly Definitions中。 记得补充元数据AOT dlls 打包完成后遇到TypeLoadException: could not load type 时 可能需要在Assets/link.xml中增加对应的设置 <assembly fullname"your assembly" preserve"all"/> link…

CNCF云原生计算基金会

CNCF&#xff0c;全称为云原生计算基金会&#xff08;Cloud Native Computing Foundation&#xff09;&#xff0c;成立于2015年&#xff0c;是一个隶属于Linux基金会的非营利组织。CNCF旨在促进和支持开源技术的发展&#xff0c;特别是那些支持云原生&#xff08;cloud native…

MongoDB的安装、配置和基本操作

一、实验目的 1. 安装MongoDB&#xff0c;并正确配置相关参数。 2. 启动MongoDB服务&#xff0c;并确认服务已成功启动。 3. 使用MongoDB shell客户端连接MongoDB实例。 4. 查看当前MongoDB实例中的全部数据库列表。 5. 停止MongoDB服务操作。 二、实验环境准备 1.…

php基本数据结构

数据结构 数组&#xff1a;包含了Java的数组、列表list、Map结构 类比Java 数组&#xff1a;$phpArray [1,2,3,4];list: $phpList ["name","age","phone"];Map: $phpMap ["name">"1" , "age">"2…