python语言基础-4 常用模块-4.9 wordcloud模块

ops/2024/11/19 19:44:35/

声明:本内容非盈利性质,也不支持任何组织或个人将其用作盈利用途。本内容来源于参考书或网站,会尽量附上原文链接,并鼓励大家看原文。侵删。

4.9 wordcloud模块

4.9.1 wordcloud库简介

wordcloud是优秀的词云展示第三方库。

词云就是以词语为基本单位,更加直观和艺术地展示文本的一种方式。

wordcloud需要安装:pip install wordcloud。

4.9.2 wordcloud库使用说明

wordcloud库把词云wordcloud(词云)当作一个对象。库中提供了针对该对象操作的方法,这些方法可以根据文本中词语出现的频率等参数绘制词云。而词云的形状、尺寸、颜色及字体等都可以通过对象参数进行配置。

(1)wordcloud中的方法

wordcloud库提供了如下常规方法:

  • .Wordcloud():创建词云对象并且可以配置对象的属性;
  • .generate(txt):向wordcloud对象中加载文本txt。其中txt可以是文本字符串;
  • .to_file(filename):将词云输出为图像文件,png或jpg格式。

(2)配置wordcloud对象的参数

wordcloud对象主要通过.wordcloud(<参数>)方法配置参数。其中的<参数>有如下选项:

  • width:指定词云生成图片的宽度,默认400像素;
  • height:指定生成词云图片的高度,默认200像素;
  • min_font_size:指定词云中字体的最小字号,默认4号;
  • max_font_size:指定词云中字体的最大字号,根据高度自动调节;
  • font_step:指定词云中字体号的步进间隔,默认为1;
  • font_path:指定字体文件路径,默认None;
  • max_words:指定词云显示的最大单词数量,默认200;
  • stop_words:指定词云中的排除词列表,即不显示的单词列表;
  • mask:指定词云的形状,默认为长方形,需要引用imread()函数;
  • background_color:指定词云图片的背景颜色,默认为黑色。

一些示例如下:

python">import wordcloud
from scipy.misc import imread  # 配置词云的形状需要用到另一个库mk = imread("pic.png")  # 配置形状变量
w = wordcloud.Wordcloud(with=600, height=400, min_font_size=10, max_font_size=20, \font_step=2, font_path="msyh.ttc", \stop_words={"python", "pycharm"}, mask=mk,\ background_color="white")
# font_path="msyh.ttc",表示使用的字体文件是微软雅黑

(3)词云使用的基本步骤

词云的使用一般为三步:1)配置对象参数;2)加载词云文本;3)输出词云文件。其中决定最终生成词云特征的主要是第一步。

简单的使用示例如下:

python">import wordcloudtxt = "life is short, you need python"
w = wordcloud.Wordcloud(background_color="white")  # 配置对象参数
w.generate(txt)  # 加载词云文本
w.to_file("python.png")  # 输出词云文件

如果是对中文使用词云,则需要jieba库进行分词。如下:

python">import jieba
import wordcloudtxt = "程序设计...运算处理"
w.wordcloud.Wordcloud(width=1000, font_path="msyh.ttc", height=700)  # 配置对象参数
w.generate("".jion(jieba.lcut(txt)))  # 加载词云文本
w.to_file("python.png")  # 输出词云文件

4.9.3 使用案例:政府工作报告词云

读取一份中文报告,然后生成词云。代码如下:

python">import jieba
import wordcloudwith open("新时代中国特色主义.txt", "r", encoding="utf-8") as f:t = f.read()ls = jieba.lcut(t)txt = "".join(ls)w = worcloud.Wordcloud(font_path="msyh.ttc", width=1000, height=700,\background_color="white")w.generate(txt)w.to_file("gr.py")

http://www.ppmy.cn/ops/135054.html

相关文章

数据结构——链表逆序详解

一、示例 二、上代码 #include <stdio.h> #include <stdlib.h>// 定义节点结构体 struct Node {int val;struct Node* next; };// 定义链表结构体 struct LinkedList {struct Node* head;struct Node* tail;int length; };// 递归法翻转链表 struct Node* reverse…

多品牌NVR管理工具/设备EasyNVR多个NVR同时管理支持RTSP接入

在当今数字化浪潮席卷全球的背景下&#xff0c;视频监控行业正经历着前所未有的变革。传统的本地录像存储模式正逐步向云端集中管理转型&#xff0c;这一技术的飞跃不仅极大地提升了监控效率与安全性&#xff0c;更为各行各业的智能化管理开辟了新路径。在这一转型过程中&#…

ctf日常

8&#xff0c; [NISACTF 2022]easyssrf 跨目录读取 NSSCTF{c42d6e04-f7cb-4ac4-925b-efd9b90c76ff} 9&#xff0c; [SWPUCTF 2021 新生赛]hardrce <?php header("Content-Type:text/html;charsetutf-8"); error_reporting(0); highlight_file(__FILE__); if(is…

软件可信评估体系

软件可信评估体系 课程&#xff1a;软件质量分析 作业 可编写下面的java程序&#xff1a; package org.example;import org.jfree.chart.ChartFactory; import org.jfree.chart.ChartUtils; import org.jfree.chart.JFreeChart; import org.jfree.chart.axis.NumberAxis; impo…

STM32 创建一个工程文件(寄存器、标准库)

首先到官网下载对应型号的固件包&#xff1a; 像我的STM32F103C8T6的就下载这个&#xff1a; 依次打开&#xff1a; .\STM32F10x_StdPeriph_Lib_V3.5.0\STM32F10x_StdPeriph_Lib_V3.5.0\Libraries\CMSIS\CM3\DeviceSupport\ST\STM32F10x\startup\arm 可以看到&#xff1a; 这…

外网访问 WebDav 服务

从外部网络环境&#xff08;比如异地和家中网络&#xff09;来访问公司内网的 WebDav 服务&#xff08;基于 IIS &#xff09;并映射成本地虚拟磁盘。 步骤如下 第一步 在公司内网的电脑上设置 webDav。 1&#xff0c;找到【控制面板】&#xff0c;双击进入。 2&#xff0c…

谷歌Gemini发布iOS版App,live语音聊天免费用!

大家好&#xff0c;我是木易&#xff0c;一个持续关注AI领域的互联网技术产品经理&#xff0c;国内Top2本科&#xff0c;美国Top10 CS研究生&#xff0c;MBA。我坚信AI是普通人变强的“外挂”&#xff0c;专注于分享AI全维度知识&#xff0c;包括但不限于AI科普&#xff0c;AI工…

STM32CUBEIDE FreeRTOS操作教程(九):eventgroup事件标志组

STM32CUBEIDE FreeRTOS操作教程&#xff08;九&#xff09;&#xff1a;eventgroup事件标志组 STM32CUBE开发环境集成了STM32 HAL库进行FreeRTOS配置和开发的组件&#xff0c;不需要用户自己进行FreeRTOS的移植。这里介绍最简化的用户操作类应用教程。以STM32F401RCT6开发板为…