WordCloud参数的用法:

server/2024/11/28 13:30:43/

-------------词云图集合-------------
用Wordcloud+PyQt5写个词云图生成器1.0
WordCloud去掉停用词(fit_words+generate)的2种用法

通过词频来绘制词云图(jieba+WordCloud)

Python教程95:去掉停用词+词频统计+jieba.tokenize示例用法

将进酒—李白process_text词频统计,及词频可视化分析

使用wordcloud模块,绘制一个自定义的词云图形状

使用WordCloud模块中repeat参数,做一个关键字重复的词云图

关于词云图显示异常,出现乱码的解决办法

盘点WordCloud模块,词云图的相关知识点

Python源码05:使用Pyecharts画词云图图

1.WordCloud参数的用法:

1.1.基本参数
font_path:字符串类型,指定字体文件的路径。由于默认字体可能不支持中文,因此需要指定一个支持中文的字体文件路径来正确显示中文。
width:整数类型,默认值为400。指定生成词云图的宽度(像素)。
height:整数类型,默认值为200。指定生成词云图的高度(像素)。
background_color:颜色值类型,默认值为"black"。指定词云图的背景颜色。
1.2.词云形状和布局
mask:ndarray类型或None,默认值为None。如果指定了一个ndarray作为遮罩,则词云图的形状将被该遮罩取代。遮罩图像中白色(#FFFFFF)的部分将不会绘制词云,其余部分将用于绘制。
scale:浮点数类型,默认值为1。指定计算和绘图之间的比例,即放大画布的尺寸(比例尺)。对于大型词云图,使用比例尺可能比设置画布尺寸更快,但单词匹配可能不是很好。
prefer_horizontal:浮点数类型,默认值为0.9。指定词语水平方向排版出现的频率。由于水平排版和垂直排版概率之和为1,因此默认垂直方向排版频率为0.1。
1.3.字体和词频
min_font_size:整数类型,默认值为4。指定词云中显示的最小字体大小。
max_font_size:整数类型或None,默认值为None。指定词云中显示的最大字体大小。如果没有设置,则直接使用画布的大小作为参考。
font_step:整数类型,默认值为1。指定词云中字体大小的步进间隔。如果步长大于1,会加快运算速度但可能导致结果出现较大的误差。
max_words:数字类型,默认值为200。指定要显示的词的最大个数。
stopwords:字符串集合或None,默认值为None。指定需要屏蔽的词。如果为空,则使用内置的停用词列表。
1.4.颜色和配色
colormap:字符串或matplotlib colormap类型,默认值为"viridis"。指定给每个单词随机分配颜色的配色方案。如果指定了color_func参数,则忽略此参数。
color_func:可调用对象,默认值为None。指定生成新颜色的函数。如果为空,则使用默认的颜色生成函数。
1.5.其他参数
mode:字符串类型,默认值为"RGB"。当参数为"RGBA"并且background_color不为空时,背景为透明。
relative_scaling:浮点数类型,默认值为0.5。指定词频和字体大小的关联性。如果设置为1,则一个单词出现两次时,其字体大小为原来的两倍。
regexp:字符串或None(可选)。指定使用正则表达式分隔输入的文本。如果没有指定,则使用默认的正则表达式进行分词。
collocations:布尔类型,默认值为True。指定是否包括两个词的搭配(双宾语)。
1.6.常用函数方法
fit_words(frequencies):根据词频生成词云。
generate(text):根据文本生成词云。
generate_from_frequencies(frequencies[, …]):根据词频生成词云,类似于fit_words方法。
generate_from_text(text):根据文本生成词云,类似于generate方法。
recolor([random_state, color_func, colormap]):对现有输出重新着色。重新上色会比重新生成整个词云快很多。

完毕!!感谢您的收看

----------★★历史博文集合★★----------

我的零基础Python教程,Python入门篇 进阶篇 视频教程 Py安装py项目 Python模块 Python爬虫 Json Xpath 正则表达式 Selenium Etree CssGui程序开发 Tkinter Pyqt5 列表元组字典数据可视化 matplotlib 词云图 Pyecharts 海龟画图 Pandas Bug处理 电脑小知识office自动化办公 编程工具 NumPy Pygame


http://www.ppmy.cn/server/145631.html

相关文章

矩阵重构——sortrows函数

s o r t r o w s sortrows sortrows函数依据某列的属性对其元素所在的行进行排序从而进行矩阵的排序 s o r t r o w s sortrows sortrows函数常用方法: 1. 1. 1. s o r t r o w s ( a , [ c 1 , c 2 ] ) sortrows(a,[c_1,c_2]) sortrows(a,[c1​,c2​])&#xff0c…

【C知道】ES6特性

请描述一下你对ES6及其后续版本(如ES7、ES8等)的新特性的理解,并举例说明在实际项目中的应用。 ES6(ECMAScript 2015),也称为ES2015,引入了一系列显著的语言改进,旨在提高开发者的工…

RuoYi排序

RuoYi框架提供了多种实现排序的方法,以满足不同场景下的需求。这里简要介绍几种常见的排序实现方式: 1. 后端排序 1.1 使用startPagePlus方法 RuoYi框架中,可以通过对BaseController进行扩展来实现更灵活的分页与排序功能。例如&#xff0…

Docker 配置 HTTP 和 HTTPS 网络代理

前言 在内网环境中,为了实现全局代理上网,Linux 系统通常通过修改 .bashrc 或 /etc/profile 等文件,设置 HTTP 和 HTTPS 代理。这种方式可以为大多数应用提供代理支持,但 Docker 并不会自动读取系统的环境变量,因此需…

TensorFlow的基本概念

一、TensorFlow简介 TensorFlow是由Google开发的开源机器学习框架,用于深度学习和其他数值计算。其核心优势在于高度灵活性,支持多平台部署(如移动设备、服务器等),并提供丰富的工具集,便于开发者快速构建…

杂7杂8学一点之多普勒效应

最重要的放在最前面,本文学习资料:B站介绍多普勒效应的优秀视频。如果上学时老师这么讲课,我估计会爱上上课。 目录 1. 多普勒效应 2. 多普勒效应对通信的影响 3. 多普勒效应对低轨卫星通信的影响 1. 多普勒效应 一个小石头扔进平静的湖面…

Java后端如何进行文件上传和下载 —— 本地版

简介: 本文详细介绍了在Java后端进行文件上传和下载的实现方法,包括文件上传保存到本地的完整流程、文件下载的代码实现,以及如何处理文件预览、下载大小限制和运行失败的问题,并提供了完整的代码示例。 大体思路 1、文件上传 …

DMS2024|思腾合力受邀参加第二届CCF数字医学大会

随着人工智能技术的不断进步,其在医学领域的应用日益广泛。从医学影像分析、疾病诊断到个性化治疗方案设计,人工智能正在逐步改变传统的医疗模式。未来,数字医学将更加注重数据的整合与挖掘,推动医学研究的深入与创新。 2024年11…