做一个简单的中文字词云记录一下聊天日常,我用的文本是从QQ导出的聊天记录, 真的很有意思,有兴趣的也可以导出来试试看 注: 1.字体文件路径:C:\Windows\Fonts\字体文件名(中文字体在最下面)2.由PS抠图保存的文件记得转化为jpg格式, 否则会是文件格式,运行不了(做的时候运行不出来, 突然意识到这个问题,,) 3.设置mode='RGBA',background_color=None词云背景为透明 (默认为黑色) 4.通过stopwords去除不需要的内容 完整代码如下: 第一步:安装好各类库
第二步:导入需要的文本(记事本形式)从QQ导出聊天记录的时候一定要选择.txt形式保存,默认保存为.bak加密文件
第三步:整理出不需要的内容
第三步:通过精确模式进行分词(#精确模式语法: cut_all=True表示采用全模型进行分词 cut_all=False,表示为精确模型)并且将内容以空格分开
第四步:打开需要的轮廓图片并转化为numpy数组
第五步:设置相应属性
最后:plt.imshow()可显示图片和格式
interplotation(图像模糊程度)的值可以为:‘none’,‘nearest’,‘bilinear’,‘bicubic’,‘spline16’,‘spline36’,‘hanning’,‘hamming’,‘hermite’,‘kaiser’,‘quadric’,‘catrom’,‘gaussian’,‘bessel’,‘mitchell’,‘sinc’,‘lanczos’
结果如下: