Python使用总结之Python文本转语音引擎：pyttsx3完全指南

在开发需要语音输出功能的应用时，文本转语音(TTS)技术是一个非常有用的工具。Python的pyttsx3库提供了一个简单且离线的方式来实现这一功能，无需依赖互联网连接或外部API。本文将详细介绍pyttsx3的安装、基础使用以及高级功能，帮助你快速掌握这一实用工具。

什么是pyttsx3？

pyttsx3是一个跨平台的Python文本转语音转换库，它可以在不需要网络连接的情况下工作。该库使用你系统上已安装的TTS引擎，如Windows上的SAPI5、macOS上的NSS和Linux上的espeak。

安装

安装pyttsx3非常简单，只需使用pip命令：

python">pip install pyttsx3

在某些系统上，可能还需要安装额外的依赖：

Windows：通常不需要额外安装（使用SAPI5）
macOS：可能需要安装PyObjC

python">pip install pyobjc

Linux：需要安装espeak

sudo apt-get install espeak

基本使用

初始化引擎并说话

以下是使用pyttsx3的最简单示例：

python">import pyttsx3# 初始化TTS引擎
engine = pyttsx3.init()# 设置要说的文本
engine.say("你好，我是Python文本转语音引擎")# 运行并等待语音完成
engine.runAndWait()

调整语音属性

1. 改变语速

语速以每分钟字数(WPM)衡量，默认值通常为200：

python"># 获取当前语速
rate = engine.getProperty('rate')
print(f"当前语速：{rate}")# 设置新的语速 (降低50%)
engine.setProperty('rate', rate-100)engine.say("这是降低语速后的语音效果")
engine.runAndWait()

2. 改变音量

音量范围从0.0到1.0：

python"># 获取当前音量
volume = engine.getProperty('volume')
print(f"当前音量：{volume}")# 设置新的音量 (0.0 到 1.0)
engine.setProperty('volume', 0.7)  # 70%音量engine.say("这是调整音量后的语音效果")
engine.runAndWait()

3. 更改声音

pyttsx3允许使用系统上可用的不同声音：

python"># 获取可用声音的列表
voices = engine.getProperty('voices')# 打印可用声音的信息
for i, voice in enumerate(voices):print(f"语音{i}:")print(f" - ID: {voice.id}")print(f" - 名称: {voice.name}")print(f" - 语言: {voice.languages}")print(f" - 性别: {voice.gender}")print(f" - 年龄: {voice.age}")# 设置第二个声音（如果有的话）
if len(voices) > 1:engine.setProperty('voice', voices[1].id)engine.say("这是使用另一个声音的效果")engine.runAndWait()

高级功能

将语音保存为文件

除了直接播放语音外，pyttsx3还可以将语音保存为音频文件：

python">engine = pyttsx3.init()# 设置要保存的文本
text = "这段文本将被保存为音频文件"# 保存为WAV文件
engine.save_to_file(text, 'output.wav')
engine.runAndWait()

使用事件回调

pyttsx3提供了事件回调机制，可以在语音开始、结束或发生错误时执行特定操作：

python">def onStart(name):print(f'开始: {name}')def onWord(name, location, length):print(f'词: {name}, 位置: {location}, 长度: {length}')def onEnd(name, completed):print(f'结束: {name}, 完成: {completed}')# 连接回调函数
engine = pyttsx3.init()
engine.connect('started-utterance', onStart)
engine.connect('started-word', onWord)
engine.connect('finished-utterance', onEnd)engine.say('这段文本将触发回调函数')
engine.runAndWait()

多线程使用

在图形界面或需要非阻塞语音输出的应用中，可以在单独的线程中运行TTS引擎：

python">import threading
import timedef speak_in_thread(text):engine = pyttsx3.init()engine.say(text)engine.runAndWait()engine.stop()# 创建一个线程来播放语音
speech_thread = threading.Thread(target=speak_in_thread, args=("这段文本将在单独的线程中播放，不会阻塞主程序",))
speech_thread.start()# 主程序可以继续执行其他任务
print("语音播放已开始，但主程序继续执行")
for i in range(5):print(f"主线程计数: {i}")time.sleep(0.5)# 等待语音线程结束
speech_thread.join()
print("语音播放完成")

实用示例

1. 简单的文本阅读器

python">import pyttsx3def text_reader(file_path):try:with open(file_path, 'r', encoding='utf-8') as file:text = file.read()engine = pyttsx3.init()print("开始阅读文件...")engine.say(text)engine.runAndWait()print("文件阅读完成")except FileNotFoundError:print(f"错误: 找不到文件 '{file_path}'")except Exception as e:print(f"发生错误: {e}")# 使用示例
text_reader('example.txt')

2. 简单的语音提醒工具

python">import pyttsx3
import time
import threadingclass VoiceReminder:def __init__(self):self.engine = pyttsx3.init()self.reminders = []self.running = Trueself.check_thread = threading.Thread(target=self._check_reminders)self.check_thread.daemon = Trueself.check_thread.start()def add_reminder(self, message, minutes):reminder_time = time.time() + minutes * 60self.reminders.append((reminder_time, message))print(f"提醒已设置: '{message}' 将在 {minutes} 分钟后提醒")def _check_reminders(self):while self.running:current_time = time.time()# 检查是否有到期的提醒for i, (reminder_time, message) in enumerate(self.reminders[:]):if current_time >= reminder_time:print(f"提醒: {message}")self.engine.say(message)self.engine.runAndWait()# 删除已触发的提醒self.reminders.pop(i)time.sleep(1)def stop(self):self.running = Falseself.check_thread.join(timeout=1)# 使用示例
reminder = VoiceReminder()
reminder.add_reminder("该喝水了", 0.1)  # 6秒后提醒
reminder.add_reminder("休息一下眼睛", 0.2)  # 12秒后提醒# 保持程序运行足够长的时间来触发提醒
time.sleep(15)
reminder.stop()