xpinyin 是一个第三方 python 库,可以将汉字(中文)转换成拼音,仅需几行代码即可。
此外,xpinyin 库还具备以下特点:
一是,xpinyin 支持多种输出格式,包括:不带声调(如:cang)、带声调(如:cáng)。
二是,可根据需求自定义拼音的输出格式,包括:输出拼音的全拼、只输出拼音的首字母、只输出拼音的声母等。
xpinyin 从安装到使用,详细教程如下。
一、xpinyin 安装
因为 xpinyin 属于第三方库,所以使用前需要先进行安装。
直接使用 pip 进行安装,完整命令:
python">pip install xpinyin
确认查看是否安装成功,可用以下命令:
python">pip show xpinyin
注:对于 python 初学者来说,python 的环境配置及第三方库的安装始终是一大难点。这里建议大家在安装 python 环境时,一定要勾选配置环境变量,这样当安装第三方库时,可以直接打开 cmd ,使用 pip 命令去安装绝大多数的库,可以省掉很多的麻烦。
二、xpinyin 使用
使用 xpinyin 库时,需要先导入相关模块,并实例化一个对象
python">from xpinyin import Pinyin#实例化 Pinyin 对象
p = Pinyin()
然后,就可以根据需求,选择合适的方法将汉字转换为拼音。
重点有以下 6 种使用情况:
(一)默认情况
默认情况下,输出的拼音不带声调,且多个汉字的拼音之间分隔符为“-”,如下:
python">astr ='藏在初雪里的心事,会被月光照亮'
#默认情况
astr1 = p.get_pinyin(astr)
print('默认情况,不带声调且分隔符为-:\n',astr1)
输出结果为:
(二)显示拼音的声调
如果想要输出的拼音显示声调,有以下两种形式。
1、标准拼音模式
如cáng,加入参数:tone_marks='marks'。
python">astr ='藏在初雪里的心事,会被月光照亮'# 标准拼音模式显示
astr1 = p.get_pinyin(astr,tone_marks='marks')
print('第一种,标准拼音声调显示:\n',astr1)
输出结果为:
2、以数字代替声调
如cang2,加入参数:tone_marks='number'。
python">astr ='藏在初雪里的心事,会被月光照亮'#显示声调以数字代替
astr2 = p.get_pinyin(astr,tone_marks='number')
print('第二种,以数字表示声调:\n',astr2)
输出结果为:
(三)多个拼音之间的分隔符
输出显示多个汉字的拼音时,可自定义分隔符。
1、去掉默认分隔符“-”
可以去掉默认分隔符“-”,加入参数:splitter='',简单使用时 splitter 可省略,参数可直接设置为:''。
python">astr ='藏在初雪里的心事,会被月光照亮'#去掉间隔符
astr1 = p.get_pinyin(astr,splitter='')
astr2 = p.get_pinyin(astr,'')
print('去掉默认分隔符-:\n',astr1)
print('去掉默认分隔符-:\n',astr2)
输出结果为:
2、指定分隔符
加入参数并赋值指定的分隔符,如:splitter='/',简单使用时 splitter 可省略,参数可直接设置为:'/'。
python">astr ='藏在初雪里的心事,会被月光照亮'#指定间隔符
astr1 = p.get_pinyin(astr,splitter='/')
astr2 = p.get_pinyin(astr,'/')
print('指定分隔符,如/:\n',astr1)
print('指定分隔符,如/:\n',astr2)
输出结果为:
(四)获取拼音首字母
获取每个汉字拼音的首字母,使用方法:get_initials()
python">astr ='藏在初雪里的心事,会被月光照亮'#获取拼音首字母
astr1 = p.get_initials(astr)
print('获取拼音首字母:\n',astr1)
输出结果为:
注:每个汉字拼音首字母之间的分隔符去除和替换,与上面第 3 点是一样的用法。
(五)获取声母
获取每个汉字拼音的声母,仅在获取首字母方法 get_initials() 中加入参数:with_retroflex=True 即可。
python">astr ='藏在初雪里的心事,会被月光照亮'#获取声母
astr1 = p.get_initials(astr,with_retroflex=True)
print('获取声母:\n',astr1)
输出结果为:
注:每个汉字拼音的声母之间的分隔符去除和替换,与上面第 3 点是一样的用法。
(六)获取汉字的多个拼音
使用 get_pinyins() 方法可以获取多音字的多个拼音。
如,“好”的拼音包括:hǎo、hào
python">astr ='好'#获取汉字的多个读音
astr1 = p.get_pinyins(astr,tone_marks='marks')
print('获取多个读音:\n',astr1)
输出结果为:
注:需要注意一下的是,这里是以列表的形式返回。
以上就是 xpinyin 库将汉字转换为拼音的核心用法,可供参考。
-end-