「AI Infra 软件开源不是一个选项,而是必然」丨云边端架构和 AI Infra专场回顾@RTE2024

news/2024/11/16 8:47:43/

在这里插入图片描述

人工智能开源技术蓬勃发展的当下,AI Infra 项目正经历着日新月异的变革。从跨平台运行时到云边端 AI 基础设施,再到多模态知识助手,创新浪潮席卷而来。这些进步不仅显著提升了技术指标,也为实时音视频处理、边缘计算、大模型应用等场景开辟了新的可能性。

在 RTE 2024 大会上,LLamaIndex 研究员郑钦月、TEN Framework 创始人 halajohn、亚马逊云科技资深开发者布道师郑予彬、声网后端媒体中心负责人曹类、WasmEdge 维护者 Michael Yuan 等行业专家分享了各自的见解和研究成果。

RTE 开发者社区主理人、小樱桃科技 CTO 杜金房主持了主题分享和圆桌讨论环节。

在这里插入图片描述

郑钦月:构建多模态知识助手,高效应用 RAG 框架

在这里插入图片描述

LLamaIndex 研究员郑钦月指出,尽管大语言模型能力不断提升,但在实际应用中仍面临着幻觉、时效性和专业性不足等问题。为解决这些问题,RAG(检索增强生成)技术应运而生,通过外接数据来最大化大模型的能力。然而,简单的 RAG 框架仍存在局限性,无法有效处理复杂任务和多模态数据。

一个理想的知识助手应具备以下特质:

1、高质量的多模态 RAG 框架, 能处理文本、图像、音视频等多种数据类型。
2、强大的任务处理能力, 不仅能回答问题,还能生成报告、制作 PPT、分析数据等。
3、具备行动能力, 能够提供下一步行动建议。

LLamaIndex 提供了一系列工具和框架来实现这一愿景:

1、LLamaParse: 一个文档解析工具,能最大限度保留文档的图表和布局信息。
2、LLamaCloud: 一个 Production-ready 的 RAG 平台,支持简单的数据输入和问答。
3、Agentic RAG: 包括有约束和无约束两种操作流程,允许多个 AI 代理协作完成复杂任务。
4、LLamaIndex Workflow: 一个事件驱动的工作流框架,用于定义和执行复杂的 AI 任务。

在这里插入图片描述

halajohn:基于 TEN Framework 的云边端 AI 基础设施与 AI Agent 应用

在这里插入图片描述

TEN Framework Creator halajohn 提出了目前基于云端的语音交互 AI 应用面临的三大挑战:高昂的云端计算成本、用户数据隐私泄露的风险,以及难以适应不同用户负载的架构扩展性问题。

面对这些挑战,halajohn 提出了他们的解决方案:TEN Framework,一个「云边端互融、跨设备、跨环境的 AI 基础设施」。

他强调了 TEN Framework 的 模块化设计理念 ,允许开发者创建可在各种平台上运行的 Extension 模块。为了方便开发者快速构建应用,「站在巨人的肩膀上」,TEN Framework 支持所有主流编程语言(C++、Python、Golang、JavaScript 等),并推出了 TEN Cloud Store,方便开发者分享和使用现成的模块,如同提供一把便捷的「铲子」,让开发者专注于挖掘应用场景的「金矿」。

TEN Framework 将不同语言编写的模块组合在同一服务中运行,优化实时音视频应用的性能,并避免微服务架构带来的性能瓶颈和跨设备难题,实现成本控制和性能保障。

他还介绍了正在开发的 Graph Designer, 一个可视化工具 ,旨在简化模块的组合、调试和流程管理,并计划引入 动态调试功能 ,方便开发者快速定位问题。

此外,他还提到通过 优化云边端传输 ,将语音交互的响应速度提升至毫秒级,并将成功率提升到 97%-98%。

目前,TEN Framework 已经开源,并期待社区的共同参与和贡献。

在这里插入图片描述

郑予彬:生成式人工智能赋能云上开发全流程

在这里插入图片描述

来自亚马逊云科技开发者体验团队的郑予彬分享聚焦于在生成式 AI 蓬勃发展的当下,云平台如何为个人和组织提供强有力的支持,以及如何通过一系列工具提升开发者体验,最终将创新落地转化为生产力。

郑予彬指出,2024 年开发者和组织对云平台的需求已经从单纯的算力转向更便捷的平台和多样化的工具。为此,云平台需要在三个层面提供支持:

1、底层 LLM 部署方面,云平台需要提供优秀的工具和标准化策略, 简化 LLM 部署流程。
2、平台层面上,需要支持企业利用自身数据定制 LLM,将基础模型转化为 专用模型。
3、最后,生成式 AI Agent 需要将模型与前端服务和应用快速连接,将 LLM 调用 融入生产流程。

Amazon Bedrock 平台预置了近十种 LLM,并提供便捷的工具帮助企业定制模型,同时兼顾安全合规。他还特别提到,他们团队更名为 「开发者体验团队」 ,正是因为开发者体验对企业创新能力至关重要。

在这里插入图片描述

曹类:十亿级月活分钟数背后的声网媒体中心架构演进之路

在这里插入图片描述

声网后端媒体中心负责人曹类分享了他在声网七年间,见证公司 从高速增长到追求极致平衡过程中 ,媒体中心架构的演进历程。

从早期的 SDK 到 Restful API,再到如今的云端应用,媒体中心的业务流程经历了多次迭代升级。然而,高速增长也带来了新的挑战:组合业务种类繁多、单一产品功能激增、成本居高不下、业务交付周期长,以及可用性问题频发。

为了解决这些问题,曹类和他的团队制定了针对性的解决方案。通过构建统一可用性系统、整合音视频能力、搭建统一编排引擎、优化资源调度和计量模型等一系列举措,他们成功地实现了降本增效,同时显著提升了系统效率和可用性。

「过去两年,我们的业务用量增长了 39%,而单位成本却降低了 56%,等价 L4 故障数降低了 50%。」

然而,曹类也深刻地认识到,架构演进是一个持续的过程,他将其比作对抗熵增,如同人的成长一样。早期低熵状态下,系统野蛮生长;中期需要积极对抗熵增,保持系统的有序性;后期则需要在可控范围内管理熵增。

在这里插入图片描述

Michael Yuan:在端侧部署多模态大模型的实践与思考

在这里插入图片描述

Michael Yuan,WasmEdge 维护者和 Second State 创始人分享了如何在边缘侧部署多模态大模型,来处理音视频数据。Yuan 开篇展示了一个将 YouTube 英文视频翻译成中文的项目。尽管看似简单,这项任务实际上融合了多个复杂步骤和技术。

Yuan 指出 Python 在大模型部署中的局限性。 虽然 Python 在模型训练阶段被广泛采用,但在推理阶段,尤其是在需要高性能和复杂业务逻辑的场景下,Python 往往会成为性能瓶颈。在云边缘计算环境中,Python 的性能问题尤为突出。Python 在实时交互场景中会导致明显的延迟,并非毫秒级,而是秒级。

Yuan 提出使用 Rust 和 WebAssembly 来解决这一难题。WebAssembly 可以作为 硬件和应用程序之间的新抽象层, 类似于曾经的 Java 虚拟机,但以 Rust 作为主要开发语言。这种方法可以有效解决跨平台部署、安全性和性能等关键问题。

在这里插入图片描述

圆桌讨论:开源 AI 项目的设计哲学和成长方法论

在这里插入图片描述

主题是 开源 AI 项目的设计哲学和成长方法论」 的圆桌讨论由 FreeSWITCH 的核心维护者杜金房主持,参与讨论的嘉宾有 WasmEdge 维护者 Michael Yuan、TEN Framework 的 halajohn 以及开源社联合创始人林旅强。

halajohn 首先分享了 TEN Framework 的设计理念:帮助开发者快速构建 AI 场景和应用,并强调其 「集百家之长」 的设计哲学有助于快速达成目标。

Michael Yuan 介绍了 WasmEdge,一个跨平台、轻量级、高性能的 AI 运行时。他指出 WasmEdge 的核心目标是实现 「模型与应用一体化」 ,将模型嵌入应用中,并在用户可控的设备上以轻量级运行时运行。

林旅强则从开源社区的角度阐述了 开源基金会的重要作用。 他认为,基金会能够有效地管理和发展开发者捐赠的项目,并构建繁荣的生态系统。他强调,项目长期发展需要基金会化和公司化,以确保其可持续性和高效决策。

谈及 AI Infra 和开源的关系,Michael Yuan 说,如果基础软件不开源,几乎不可能得到机会。不开源意味着无法让大家试用,这会让人对基础软件的可靠性产生怀疑。在今天,做基础软件的人几乎没有不开源的选择—— 开源不是一个选项,而是必然。

在这里插入图片描述

在个人成长经验分享环节,三位嘉宾也提供了宝贵的建议。Michael Yuan 强调了 开源项目贡献代码的重要性, 认为这是伴随终身的宝贵财富。halajohn 提出了三点建议: 保持追根究底的精神、勇于尝试、运用费曼学习法。 林旅强则以《鸟哥的 Linux 私房菜》为例,说明了 把握时代需求、持续输出 的重要性。

这场圆桌讨论不仅涵盖了开源 AI 项目的技术层面,更深入探讨了个人成长和社区建设。正如林旅强总结道:「紧跟时代需求,持续输出,创造人人需要的产品,无论是书籍、TEN 框架还是 WasmEdge,只要能够帮助他人,社区就会给予回报,这对于项目发展和个人成长都至关重要。」

在这里插入图片描述


http://www.ppmy.cn/news/1547410.html

相关文章

Rust,删除cargo安装的可执行文件

列出安装的文件列表 cargo install --list 删除 rm /Users/ry/.cargo/bin/fancy

Java EE 技术基础知识体系梳理

1. Java EE 平台概述 1.1 发展历程 Java EE 从 J2EE 发展而来,经历了多个版本的演进,从早期的 J2EE 1.2 到最新的 Jakarta EE。 1.2 架构特点 多层架构: 客户端层:用户界面,如 Web 浏览器、移动应用等。Web 层&…

ssm092基于Tomcat技术的车库智能管理平台+jsp(论文+源码)_kaic

毕 业 设 计(论 文) 题目:车库智能管理平台设计与实现 摘 要 现代经济快节奏发展以及不断完善升级的信息化技术,让传统数据信息的管理升级为软件存储,归纳,集中处理数据信息的管理方式。本车库智能管理平台…

Kafka常见问题及处理

Apache Kafka是一个分布式流处理平台,以其高吞吐量和可扩展性而广受欢迎。然而,在实际应用中,我们可能会遇到各种问题。本文将探讨一些Kafka的常见问题及其解决方案,帮助您更有效地管理和使用Kafka。 1. 高延迟问题 问题描述&am…

微搭低代码入门04数组

目录 1 数组的定义和赋值2 访问数组中的元素3 获取数组的长度4 给数组添加元素5 删除数组中的元素6 其他常见用法7 数组作为参数传递8 数组的嵌套9 不改变原数组的方法总结 我们日常经常说的编程,叫编写程序。那程序的核心组成是数据结构算法。我们在编程入门的时候…

maven的optional选项说明以及具体应用

写在前面 本文看下maven的optional选项的作用和用法。 1:什么作用 考虑这样的场景,A依赖B,B依赖C,正常的按照依赖的传递性,A也会间接的依赖C,但是在一些特定的场景中项目A只希望依赖B,而不依…

H5页面多个视频如何只同时播放一个?

目录 背景1. 首先介绍下 muted 属性2. 监听播放和暂停操作3. 视频播放完毕后返回桌面,再进入H5页面发现视频封面丢失置灰解决思路: 背景 页面模块同时有个四个视频模块,发现可以同时播放四个视频,但是理想的是每次只播放一个。 …

ApiSmart-QWen2.5 coder vs GPT-4o 那个更强? ApiSmart 测评

QWen2.5 coder vs GPT-4o 那个更强? 那个更快, 那个更精准,让我们来看看; ApiSmart Api design Copilot - ApiHugApiSmart make your api design and implement happierhttps://apihug.com/zhCN-docs/copilot 【Apismart】QWen2.…