简介
谷歌翻译库Googletrans
久负盛名,但是由于tk
值计算问题,频繁出现AttributeError: 'NoneType' object has no attribute 'group'
异常。
google_trans_new
库在Googletrans
的基础上进行了完善,算是能够正常运行吧,但是效果也不太尽如人意,翻译结果与谷歌翻译网页结果不太一致,翻译效果较差。
项目地址为https://github.com/lushan88a/google_trans_new。
google_trans_new
库当前发行版本为1.1.9,可使用pip install google_trans_new
。
注意!1.19版本有一个问题没有修复,导致会出现json解析异常json.decoder.JSONDecodeError: Extra data: line 1 column 300 (char 299)
。
作者虽然修复了这个问题,但是一直没有将最新代码推送到pip。
因此,解决方法有两种:
- 安装1.19版本,找到
google_trans_new.py
,将第151行response = (decoded_line + ']')
修改为response = decoded_line
。 - 到下载最新源码进行源码安装或者直接覆盖原有
google_trans_new.py
。
使用方法
快捷翻译
- 导入
google_translator
类 - 构造
google_translator
类实例。 - 调用
translate
方法,指定待翻译文本、翻译目标语言。 - 结果返回翻译文本。
from google_trans_new import google_translator translator = google_translator()
translate_text = translator.translate('สวัสดีจีน',lang_tgt='en')
print(translate_text)
结果为:Hello Chinese
检测语言
- 导入
google_translator
类 - 构造
google_translator
类实例。 - 调用
detect
方法,指定待翻译文本。 - 结果返回检测语言列表。
from google_trans_new import google_translator detector = google_translator()
detect_result = detector.detect('สวัสดีจีน')
print(detect_result)
结果为:['th', 'thai']
检测结果发音
- 导入
google_translator
类 - 构造
google_translator
类实例。 - 调用
translate
方法,指定待翻译文本、文本源语言、翻译目标语言,设置pronounce
参数为True
。 - 结果返回翻译文本及文本发音。
from google_trans_new import google_translator translator = google_translator()
Pronounce = translator.translate('สวัสดีจีน',lang_src='th',lang_tgt='zh-cn',pronounce=True)
print(Pronounce)
源码分析
google_trans_new
库的结构非常简单:
│ __init__.py # 重构命名空间,暴露google_translator类
│ constant.py # 定义LANGUAGES(语言列表)和DEFAULT_SERVICE_URLS (谷歌翻译地址)
│ google_trans_new.py # 翻译API
google_trans_new.py
模块主要包含google_new_transError(Exception)
和google_translator
两个类。
google_translator
类的方法如下:
-
构造方法:签名为
__init__(self, url_suffix="cn", timeout=5, proxies=None)
- 参数:
url_suffix
指定谷歌翻译地址,默认值为cn
。timeout
指定超时时间,默认值为5
。proxies
指定代理。
- 参数:
-
请求构造方法:签名为
_package_rpc(self, text, lang_src='auto', lang_tgt='auto')
- 参数:
text
待翻译文本。lang_src
翻译文本源语言,默认值为auto
,即自动。lang_tgt
翻译文本目标语言,默认值为auto
,即自动。
- 返回值:请求字符串。
- 参数:
-
翻译方法:签名为
translate(self, text, lang_tgt='auto', lang_src='auto', pronounce=False)
- 参数:
text
待翻译文本。用于调用_package_rpc
方法构造请求。lang_src
翻译文本源语言,默认值为auto
,即自动。用于调用_package_rpc
方法构造请求数据。lang_tgt
翻译文本目标语言,默认值为auto
,即自动。用于调用_package_rpc
方法构造请求数据。pronounce
是否返回发音。
- 返回值:翻译结果。
- 大致流程:
- 检测翻译语言参数是否合法,不合法设置为默认值。
- 检测文本是否超过5000字符,超过提示异常。
- 通过
_package_rpc
构造请求数据。 - 通过
requests
库返回请求结果。 - 解析请求结果。
- 参数:
-
语言检测方法:签名为
detect(self, text)
- 参数:
text
待检测文本。
- 返回值:检测结果。
- 参数: