WordCloud参数的用法:

ops/2024/11/28 9:30:16/

-------------词云图集合-------------
用Wordcloud+PyQt5写个词云图生成器1.0
WordCloud去掉停用词(fit_words+generate)的2种用法

通过词频来绘制词云图(jieba+WordCloud)

Python教程95:去掉停用词+词频统计+jieba.tokenize示例用法

将进酒—李白process_text词频统计,及词频可视化分析

使用wordcloud模块,绘制一个自定义的词云图形状

使用WordCloud模块中repeat参数,做一个关键字重复的词云图

关于词云图显示异常,出现乱码的解决办法

盘点WordCloud模块,词云图的相关知识点

Python源码05:使用Pyecharts画词云图图

1.WordCloud参数的用法:

1.1.基本参数
font_path:字符串类型,指定字体文件的路径。由于默认字体可能不支持中文,因此需要指定一个支持中文的字体文件路径来正确显示中文。
width:整数类型,默认值为400。指定生成词云图的宽度(像素)。
height:整数类型,默认值为200。指定生成词云图的高度(像素)。
background_color:颜色值类型,默认值为"black"。指定词云图的背景颜色。
1.2.词云形状和布局
mask:ndarray类型或None,默认值为None。如果指定了一个ndarray作为遮罩,则词云图的形状将被该遮罩取代。遮罩图像中白色(#FFFFFF)的部分将不会绘制词云,其余部分将用于绘制。
scale:浮点数类型,默认值为1。指定计算和绘图之间的比例,即放大画布的尺寸(比例尺)。对于大型词云图,使用比例尺可能比设置画布尺寸更快,但单词匹配可能不是很好。
prefer_horizontal:浮点数类型,默认值为0.9。指定词语水平方向排版出现的频率。由于水平排版和垂直排版概率之和为1,因此默认垂直方向排版频率为0.1。
1.3.字体和词频
min_font_size:整数类型,默认值为4。指定词云中显示的最小字体大小。
max_font_size:整数类型或None,默认值为None。指定词云中显示的最大字体大小。如果没有设置,则直接使用画布的大小作为参考。
font_step:整数类型,默认值为1。指定词云中字体大小的步进间隔。如果步长大于1,会加快运算速度但可能导致结果出现较大的误差。
max_words:数字类型,默认值为200。指定要显示的词的最大个数。
stopwords:字符串集合或None,默认值为None。指定需要屏蔽的词。如果为空,则使用内置的停用词列表。
1.4.颜色和配色
colormap:字符串或matplotlib colormap类型,默认值为"viridis"。指定给每个单词随机分配颜色的配色方案。如果指定了color_func参数,则忽略此参数。
color_func:可调用对象,默认值为None。指定生成新颜色的函数。如果为空,则使用默认的颜色生成函数。
1.5.其他参数
mode:字符串类型,默认值为"RGB"。当参数为"RGBA"并且background_color不为空时,背景为透明。
relative_scaling:浮点数类型,默认值为0.5。指定词频和字体大小的关联性。如果设置为1,则一个单词出现两次时,其字体大小为原来的两倍。
regexp:字符串或None(可选)。指定使用正则表达式分隔输入的文本。如果没有指定,则使用默认的正则表达式进行分词。
collocations:布尔类型,默认值为True。指定是否包括两个词的搭配(双宾语)。
1.6.常用函数方法
fit_words(frequencies):根据词频生成词云。
generate(text):根据文本生成词云。
generate_from_frequencies(frequencies[, …]):根据词频生成词云,类似于fit_words方法。
generate_from_text(text):根据文本生成词云,类似于generate方法。
recolor([random_state, color_func, colormap]):对现有输出重新着色。重新上色会比重新生成整个词云快很多。

完毕!!感谢您的收看

----------★★历史博文集合★★----------

我的零基础Python教程,Python入门篇 进阶篇 视频教程 Py安装py项目 Python模块 Python爬虫 Json Xpath 正则表达式 Selenium Etree CssGui程序开发 Tkinter Pyqt5 列表元组字典数据可视化 matplotlib 词云图 Pyecharts 海龟画图 Pandas Bug处理 电脑小知识office自动化办公 编程工具 NumPy Pygame


http://www.ppmy.cn/ops/137318.html

相关文章

HTTP有哪些风险?是怎么解决的?

一、风险 HTTP是通过明文传输的,存在窃听风险、篡改风险以及冒充风险。 二、如何解决 HTTPS在HTTP的下层加了一个SSL/TLS层,保证了安全,通过混合加密解决窃听风险、数字签名解决篡改风险、数字证书解决冒充风险。 (1&#xff0…

Ubuntu20.04运行msckf_vio

文章目录 环境配置修改编译项目运行MSCKF_VIO运行 Launch 文件运行 rviz播放 ROSBAG 数据集 运行结果修改mskcf 保存轨迹EVO轨迹评价EVO轨迹评估流程实操先把euroc的真值转换为tum,保存为data.tum正式评估 报错1问题描述 报错2问题描述问题分析问题解决 参考 环境配…

Error executing a python function in exec_func_python() autogenerated

具体错误 ERROR: docker-ce-20.10.25-cegit791d8ab87747169b4cbfcdf2fd57c81952bae6d5-r0 do_unpack: Error executing a python function in exec_func_python() autogenerated:The stack trace of python calls that resulted in this exception/failure was: File: exec_fu…

解决虚拟机中 GitHub 无法通过 HTTPS 访问的问题

目录 1.在虚拟机中可以ping通github,但无法curl2.防火墙问题参考 1.在虚拟机中可以ping通github,但无法curl damondamon-virtual-machine:~/SchurVINS_ws/src$ ping github.com PING github.com (20.205.243.166) 56(84) bytes of data. 64 字节&#x…

《OpenCV 图像缩放、翻转与变换全攻略:从基础操作到高级应用实战》

简介:本文详细阐述了 OpenCV 在图像操作中的关键技术,包括缩放(确定尺寸缩放与按比例缩放)、翻转(沿不同轴的翻转方式)以及变换(平移、旋转、三点确定变换和四点确定变换即透视变换)…

ubuntu,rocky的安装和使用远程连接工具连接服务器

Ubuntu的安装 下载最小版的ubuntu的iso镜像:https://mirrors.aliyun.com/ubuntu-releases/24.04/ubuntu-24.04.1-live-server-amd64.iso rocky的安装 下载最小版的ubuntu的iso镜像:Rocky Linux 使用学会使用远程连接工具连接服务器 使用xshell连接Ubu…

NLP论文速读(EMNLP2024)|多风格可控生成的动态多奖励权重

论文速读|Dynamic Multi-Reward Weighting for Multi-Style Controllable Generation 论文信息: 简介: 本文探讨了文本风格在沟通中的重要性,指出文本风格传达了除原始语义内容之外的多种信息,如人际关系动态(例如正式…

深入解析下oracle char和varchar2底层存储方式

oracle数据库中,char和varchar2数据类型用来存储字符数据。char类型一旦定义多大,那么它就分配多少字节空间;varchar2类型定义多大,代表它可以扩展的最大大小为多大,一开始空间根据使用来决定。字符数据存储在oracle表…