工作坊报名|使用 TEN 与 Azure,探索你的多模态交互新场景

ops/2024/11/27 11:44:49/

在这里插入图片描述

GPT-4o Realtime API 发布,语音 AI 技术正在进入一场新的爆发。语音AI技术的实时语音和视觉互动能力将为我们带来更多全新创意和应用场景。

  • 实时音频交互: 允许应用程序实时接收并响应语音和文本输入。
  • 自然语音生成: 减少 AI 技术生成的语音机械感,使对话更加人性化
  • 多语言能力: 促进多语言之间的无缝对话,特别适合全球企业的需求。
  • 更快的响应时间: 显著降低延迟,提高语音交互的速度。

现在让我们快速动手来实现一种想法。

在这场工作坊中,你会接触到 TEN Framework,市面上率先兼容了 Realtime API 和 RTC 的实时多模态 AI Agent 框架!以及使用 TEN 开发的多模态 AI Agent — TEN Agent,它能够立即响应你的语音指令,基于视频进行图像理解,并且还能进行网页和天气检索,让你感受到更自然的人机互动体验。

同时,作为全球领先的企业级公有云平台服务,Microsoft Azure OpenAI (海外版) 提供了先进的模型服务,并且全面推动了企业数字化转型的进程,开启了全新的业务模式与应用场景。无论是在客户服务、教育培训,还是娱乐等领域,实时语音和视觉交互能力都将为各行各业带来前所未有的创新机会。

现在报名参与工作坊,使用 TEN framework 与 Azure,尝试自定义一个实时多模态 Agent,即刻探索自己的语音、视频交互的新场景。

在这里插入图片描述

现场有来自 TEN Framework 与微软的答疑指导,还为大家准备了精美茶歇与开发者礼品。即刻报名!

【活动为审核制】

活动时间
12月5日(周四)13:30-17:30

活动地点
北京微软大厦(具体场地审核通过后入群通知)

活动流程
13:00 - 13:30 签到
13:30 - 14:30 主题分享
(1)基于 Azure AI 的端到端语音交互,Zhi Wang,微软创新技术架构师
(2)TEN 开源框架及最佳实践,plutoless,TEN Framework 共同发起者
14:30 - 17:30 动手实操 TEN+Azure (茶歇&礼品)

动手实操 TEN+Azure
我们为大家准备了几步实时多模态 AI Agent 挑战,帮助大家循序渐进地了解、使用 TEN Framework。

•阶段1 在本地把 TEN Agent 跑起来,并使用 STT + LLM + TTS 与 TEN Agent 对话。(1) 使用 camera.va graph;
(2)使用 Azure 提供的 STT/TTS/LLM key, 成功启动 Agent;并可调整 LLM 的提示词(Prompt)、开场白(greeting)等等,自定义你的 Agent 体验。

•阶段2 在 TEN 上体验使用 OpenAI Realtime API。
(1) 使用 v2v graph;
(2)使用 Azure 提供的 Realtime API Key,并成功启动 Agent;并可调整 LLM 的提示词(Prompt)、开场白(greeting)等等,自定义你的 Agent 体验。

•阶段3 在 TEN 上链接 Bing search的插件(extension)增加搜索能力。了解如何调用现成的插件/工具,为你的 Agent 赋予更多功能。完成挑战将获得由微软和 TEN Framework 提供的开发者礼品~

建议报名参与者提前做好如下软硬件配置:
•知识:会用命令行、git 和 Docker;
•提前下载:Docker and Docker compose;
•自备电脑一台。

报名并审核通过后, 将会邀请大家进入工作坊专属答疑群,搞定前序工作,现场专注探索你的实时 AI 场景!

还可参考以下链接:
•Azure OpenAI (海外版) 官方文档:https://learn.microsoft.com/en-us/azure/ai-services/openai/overview
•TEN README 英文:https://github.com/TEN-framework/TEN-Agent
•TEN README 中文:https://github.com/ten-framework/ten-agent/blob/main/docs/readmes/README-CN.md

欢迎报名~
在这里插入图片描述
在这里插入图片描述


http://www.ppmy.cn/ops/137071.html

相关文章

多任务基础知识学习

一、单任务与多任务的区别: 学习链接:https://zhuanlan.zhihu.com/p/27421983 多任务学习:单模型解决多个问题_什么是单任务模型-CSDN博客 SingleTask: Train one model for each task, respectively 多任务学习(Multi-Task Leamning,MTL)是机器学习只…

微信小程序中会议列表页面的前后端实现

题外话:想通过集成腾讯IM来解决即时聊天的问题,如果含语音视频,腾讯组件一年5万起步,贵了!后面我们改为自己实现这个功能,这里只是个总结而已。 图文会诊需求 首先是个图文列表界面 同个界面可以查看具体…

java框架Netty网络编程——问鼎篇

Netty进阶 01 初识 Netty:为什么 Netty 这么流行? 粘包现象 案例 服务端代码 public static void main(String[] args) {NioEventLoopGroup bossGroupnew NioEventLoopGroup(1);NioEventLoopGroup workerGroupnew NioEventLoopGroup(2);try {ServerBoo…

对比C++,Rust在内存安全上做的努力

简介 近年来,越来越多的组织表示,如果新项目在技术选型时需要使用系统级开发语言,那么不要选择使用C/C这种内存不安全的系统语言,推荐使用内存安全的Rust作为替代。 谷歌也声称,Android 的安全漏洞,从 20…

网络研讨会——如何使用Figma、Canva或Sketch设计Delphi移动应用程序

2024年11月30日星期六 - 北京午夜12点 如何使用Figma、Canva或Sketch设计Delphi移动应用程序 专业设计应用程序Figma、Sketch和Canva有大量优秀的应用程序设计等着你去实现。我们看看有什么可用的,并使用一些最好的设计来创建应用程序。。。 立即报名免费在线研讨会…

Redis(非关系型数据库)的作用 详细解读

edis(Remote Dictionary Server)是一个开源的、高性能的、基于内存的数据结构存储系统。它具有极高的读写性能,并且能够支持多种数据结构的存储。Redis 最初的设计目标是作为一个缓存解决方案,但随着其功能的不断扩展,…

VMware安装CentOS 9 及mysql的安装

VMware安装CentOS9 Linux下安装Mysql windows ide 连接Linux mysql数据库报错 DBMS: MySQL (no ver.) Case sensitivity: plainmixed, delimitedexactConnection timed out: connect. No appropriate protocol (protocol is disabled or cipher suites are inappropriate).解…

uniapp vue2项目迁移vue3项目

uniapp vue2项目迁移vue3项目,必须适配的部分 一、main.js 创建应用实例 // 之前 - Vue 2 import Vue from vue import App from ./App Vue.config.productionTip false // vue3 不再需要 App.mpType app // vue3 不再需要 const app new Vue({ ...App }) …