一、简介
随着智能手机的普及,使用蓝牙耳机的用户越来越多,尤其是骑行或步行用户。由于蓝牙耳机体型较小,按键很少,一些蓝牙耳机需要按组合键来完成相应操作,因此造成蓝牙耳机操作比较复杂,用户体验较差,尤其是在车载环境下,还涉及安全因素。
现在市场上一些高端蓝牙耳机已经支持通过语音命令来代替手工操作,但就我发现,现在新出的带蓝牙功能的耳机,还在用一个语音识别芯片加一个蓝牙芯片来完成这个方案,我觉得这是一种资源的浪费。本文介绍的是唯创知音的一个用单芯片WTK6900H完成带语音识别的蓝牙耳机设计方案。
二、方案框架:
MIC 录音(用户说话的声音),送入 WTK6900H IC ASR(语音识别)引擎去做识别计算。通过 BT 与手机语音助手 APP 通讯。播放的音频通过WTK6900H IC,DAC 接 PA(功放)IC,驱动喇叭播放出来。
三、识别指令
唤醒词:小艾同学
离线语音控制指令:
打开语音助手、接听电话、挂断电话、、上一曲、上一首、下一曲、下一首、播放音乐、继续播放、暂停播放、暂停音乐、停止播放、音量大一点、调大音量、音量小一点、调小音量、最大音量、中等音量、最小音量、关闭静音、打开静音。
智能语音识别蓝牙方案是促成蓝牙设备的智能化,让蓝牙连接手机语音助手 APP,以手机为中心,蓝牙轻松拥有 AI 智能交互能力,具备和智能音箱一样的用户体验,无需动手,就可以根据用户输入的语音信息选择和播放音乐,解放了用户的双手,在骑行或运动或开车时仅需通过语音命令就可以选择想听的音乐,同时还具有接听电话功能,使用户在骑行或步行或开车时可以通过语音接听电话,趣味对话,听笑话,小品,相声等娱乐功能,把耳机这个原来只是听音乐的设备升级到智能化控制终端。
四、电路设计
方案采用WTK6900H语音识别芯片,具备高性价比特点,设计外围元件少,电路简单,可直接降低BOM综合成本及缩短项目开发周期。方案支持标准BLE透传和语音识别功能,3-5米识别距离,识别率可达90%。原理图如下:
五、WTK6900H芯片资源说明
-
内核和存储
-
高性能32位内核,主频 240MHz,支持硬件浮点运算
-
内置 1MB SPI FLASH
-
AI 算法
-
离线语音识别,采用最新的神经网络算法,具有识别精准,误判率低等优势,5 米 远场可靠识别
-
语音降噪算法:过滤掉稳态噪声、对动态噪声也有很好的抑制作用,噪音下也可准确识别
-
音频解码:
-
支持 MP3,WAV 音频解码
-
音频
-
两通道 16 位 DAC,SNR> = 95dB
-
单通道 16 位 ADC,SNR> = 90dB
-
采样率支持 8KHz / 11.025KHz / 16KHz / 22.05KHz / 24KHz /32KHz / 44.1KHz / 48KHz
-
DAC 支持直推式输出
-
电源
-
VCC 为 3.3V 至 5.5V
-
VOUT 为 2.2V 至 3.4V
-
蓝牙
-
符合蓝牙 V5.1 + BR + EDR + BLE 规范
-
满足 Class1 class2 和 class3 传输功耗需求
-
支持 GFSK 和 π/ 4 DQPSK 所有包装类型
-
提供+ 6dbm 发射功率
-
具有-90dBm 灵敏度的接收器
-
快速 AGC 可增强动态范围
-
支持 a2dp \ avctp \ avdtp \ avrcp \ hfp \ spp \ smp \ att \ gap \ gatt \ rfcomm \ sdp \ l2ca 配置文件
-
外设
-
四个多功能 16 位定时器,支持捕获和 PWM 模式
-
两个16 位 PWM 驱动发生器
-
一个全双工基本 UART
-
一个 SPI 接口支持主机和设备模式
-
所有 GPIO 上的外部唤醒/中断
唯创知音作为一家专注于语音技术研究的高新技术企业,始终坚持以“服务好工程师”为目标,以行业语音交互器件标准化为方向,致力于让复杂变简单,提供快捷的语音交互应用解决方案。WTK6900H应用设计方案,在智能照明、智能家电等消费电子行业领域内已有成熟的应用案例。消费类电子产品应用是公司重要的发展领域,未来,唯创知音将在更多行业推出标准化语音识别方案,进一步提升工程师的设计体验,为消费类电子行业标准化赋能。