8、开发与大模型对话的独立语音设备

news/2024/10/6 15:42:32/

一、设计原理

该系统的核心部分主要由ESP32-WROVER开发板和ESP32-CAM摄像头、MAX9814麦克风放大器模块、MAX98357功放、声音传感器和SU-03T语音识别芯片构成。通过使用ESP32-WROVER开发板,用户可以实现通过语音与ai进行交互并进行人脸识别。
系统中,从外部输入电源中获取电源,经过稳压处理,给整个模组供电,ESP32-WROVER主要用来控制整个系统,该设备通过声音传感器实时监听,当声音强度超过阈值后,接收来自MAX9814的语音信号采样值,进行数据处理,得到pcm音频的Base64编码字符串,然后通过ESP32-WROVER自带的wifi模块将pcm音频通过http请求发送至服务器,从响应中获取到ai回复后的音频,再通过MAX98357播放ai回复的音频,从而实现与ai实时语音交互
人脸识别通过SU-03T监听唤醒词,设备唤醒后,控制ESP32-CAM摄像头开始拍照,在ESP32-CAM中将jpeg格式图片进行base64编码成字符串,通过串口传给ESP32-WROVER主控芯片。ESP32-WROVER通过自带的wifi模块将图片通过http请求发送至服务器,在服务器中进行人脸检测,若是认识的则回复招呼语句,若是陌生人则进行人脸绑定。

二、电路原理图及硬件配置

硬件配置:ESP32-WROVER开发板、ESP32-CAM摄像头、MAX9814音频放大模块、MAX98357音频功放模块、声音传感器、SU-03T语音识别模块。
整体硬件原理图:

实物实现图:


http://www.ppmy.cn/news/1473961.html

相关文章

Cocos Creator 游戏性能优化指南

性能优化 引言一、减少Draw Call什么是Draw Call?为什么要减少Draw Call?减少Draw Call的方法1、剔除I、视锥剔除:摄像机的位置和视角形成一个视锥体,只有位于视锥体内的对象才会被渲染。可以通过检查对象的包围盒(Bou…

uni-app使用ucharts地图,自定义Tooltip鼠标悬浮显示内容并且根据@getIndex点击事件获取点击的地区下标和地区名

项目场景: uni-app使用ucharts地图,自定义Tooltip鼠标悬浮显示内容并且根据getIndex点击事件获取点击的地区下标和地区名 例如: 问题描述 官方给的文档有限,需要自己下载地图json数据然后自己渲染和编写鼠标悬浮显示内容以及获取点击地址…

高效使用 Guzzle:POST 请求与请求体参数的最佳实践

介绍 在现代爬虫技术中,高效发送 HTTP 请求并处理响应数据是关键步骤之一。Guzzle 是一个强大的 PHP HTTP 客户端,广泛应用于发送同步和异步请求。本文将介绍如何使用 Guzzle 发送 POST 请求,特别是如何传递请求体参数,并结合代理…

【面向就业的Linux基础】从入门到熟练,探索Linux的秘密(十二)-管道、环境变量、常用命令

大致介绍了一下管道、环境变量、一些常用的基本命令,可以当作学习笔记收藏学习一下!!! 文章目录 前言 一、管道 二、环境变量 1.概念 2.查看 3.修改 4.常用环境变量 三、系统状况 总结 前言 大致介绍了一下管道、环境变量、一些常…

Spring Boot中的领域驱动设计

Spring Boot中的领域驱动设计 大家好,我是免费搭建查券返利机器人省钱赚佣金就用微赚淘客系统3.0的小编,也是冬天不穿秋裤,天冷也要风度的程序猿!领域驱动设计(Domain-Driven Design,简称DDD)是…

自定义编写 MySQL 语句 SELECT * 及返回对象用 MySQL 表映射类接收值为空的定位及处理

在实际的开发过程中,维护老代码并增加新功能是常见的任务。这篇文章将探讨在维护过程中遇到的一个问题:在对应的表中添加新字段后,表映射实体类中新增的字段因命名不符合驼峰命名规则,导致查询结果值为空的问题。 一、问题背景 …

每天一个数据分析题(四百零五)- 因子分析

因子分析是一种经典的统计分析方法,关于因子分析下列说法错误的是( )。 A. 因子分析是一种数据简化的技术 B. 最大似然法是因子载荷矩阵的估计方法之一 C. 因子旋转时采用最大方差旋转是一种正交旋转 D. 因子分析的假设中没有规定特殊因子…

计算机视觉是什么,涉及的关键技术和应用领域

计算机视觉是一门技术,它是人工智能(AI)的一个重要分支,它使计算机能够从图像或视频中识别、处理和理解视觉信息。它的研究和应用涉及多个领域,包括工业自动化、安全监控、医疗诊断、交通管理等。计算机视觉的应用非常…