wordcloud库基本介绍

devtools/2024/11/16 5:19:50/

文章目录

    • wordcloud库概述
      • wordcloud库的安装
    • wordcloud库使用说明
      • 配置对象参数
    • wordcloud应用实例
    • 实例: 政府工作报告词云

wordcloud库概述

wordcloud是优秀的词云展示第三方库
词云以词语为基本单位,更加直观和艺术地展示文本
在这里插入图片描述

wordcloud库的安装

(cmd命令行) pip install wordcloud

在这里插入图片描述

wordcloud库使用说明

wordcloud库把词云当作一个wordcloud对象

  • wordcloud.WordCloud() 代表一个文本对应的词云
  • 可以根据文本中词语出现的概率等参数绘制词云
  • 词云的绘制形状,尺寸和颜色都可以设定

wordcloud库常规方法
w = wordcloud.WordCloud()

  • 以WordCloud对象为基础
  • 配置参数,加载文件,输出文件
    在这里插入图片描述
python">import wordcloud
c = wordcloud.WordCloud() # 步骤1: 配置对象参数
c.generate("wordcloud by Python") # 步骤2: 加载词云文本
c.to_file("pywordcloud.png") # 步骤三: 输出词云文件

在这里插入图片描述
在这里插入图片描述

配置对象参数

w = wordcloud.WordCloud(<参数>)

参数描述
width指定词云对象生成图片的宽度,默认400像素 w=wordcloud.WordCloud(width=600)
height指定词云对象生成图片的高度,默认200像素 w=wordcloud.WordCloud(height=400)

在这里插入图片描述

在这里插入图片描述
在这里插入图片描述

wordcloud应用实例

python">import wordcloud
txt = "life is short,you need python"
w = wordcloud.WordCloud(background_color="purple")
w.generate(txt)
w.to_file("pywcloud.png")

以空格分隔单词
在这里插入图片描述
中文需要先分词并组成空格分隔字符串

python">import wordcloud
import jieba
txt = "程序设计语言是计算机能够理解和\
识别用户操作意图的一种交互体系,它按照\
特定规则组织计算机指令,使计算机能够自\
动进行各种运算处理。"
w = wordcloud.WordCloud(width=1000,font_path="msyh.ttc",height=700)
w.generate(" ".join(jieba.lcut(txt)))
w.to_file("py.jpg")

在这里插入图片描述

实例: 政府工作报告词云

问题分析: 直观了解政策文件

  • 需求: 对于政府工作报告等政策文件,如何直观理解?
  • 体会直观的价值: 生成词云 & 优化词云

政府工作报告等文件 ⇒ 有效展示的词云
这个案例我们使用的材料:材料

思路:

  1. 读取文件,分词整理
  2. 设置并输出词云
  3. 观察结果,优化迭代

代码:

python">import jieba
import wordcloud
f = open("1.txt","r",encoding="utf-8")
t = f.read()
f.close()
ls = jieba.lcut(t)
txt = " ".join(ls)
w = wordcloud.WordCloud(font_path="msy.ttc",width=1000,height=700,background_color="white")
w.generate(txt)
w.to_file("wordcloud.jpg")

在这里插入图片描述
还有一些其他更丰富的词云就自己探索叭!


http://www.ppmy.cn/devtools/134348.html

相关文章

使用Git工具在GitHub的仓库中上传文件夹(超详细)

如何使用Git工具在GitHub的仓库中上传文件夹&#xff1f; 如果觉得博主写的还可以&#xff0c;点赞收藏关注噢~ 第一步&#xff1a;拥有一个本地的仓库 可以fork别人的仓库或者自己新创建 fork别人的仓库 或者自己创建一个仓库 按照要求填写完成后&#xff0c;点击按钮创建…

单元测试、集成测试、系统测试、验收测试、压力测试、性能测试、安全性测试、兼容性测试、回归测试(超详细的分类介绍及教学)

目录 1.单元测试 实现单元测试的方法&#xff1a; 注意事项&#xff1a; 2.集成测试 需注意事项&#xff1a; 实现集成测试的方法&#xff1a; 如何实现高效且可靠的集成测试&#xff1a; 3.系统测试 实现系统测试的方法: 须知注意事项&#xff1a; 4.验收测试 实现验…

SQL面试题——蚂蚁SQL面试题 连续3天减少碳排放量不低于100的用户

连续3天减少碳排放量不低于100的用户 这是一道来自蚂蚁的面试题目,要求我们找出连续3天减少碳排放量低于100的用户,之前我们分析过两道关于连续的问题了 SQL面试题——最大连续登陆问题 SQL面试题——球员连续四次得分 这两个问题都是跟连续有关的,但是球员连续得分的难…

Vue3 - 小兔仙 - day3

0.学习大纲 1.Home模块 静态结构搭建和分类实现 整体结构创建 按照结构新增五个组件&#xff0c;准备最简单的模版&#xff0c;分别在Home模块的入口组件中引入 HomeCategory HomeBanner HomeNew HomeHot HomeProduct 在组件中添加简单模版 <script setup> <…

解析安卓镜像包和提取DTB文件的操作日志

概述 想查看一下安卓的镜像包里都存了什么内容 步骤 使用RKDevTool_v3.15对RK3528_DC_HK1_RBOX_K8_Multi_WIFI_13_20230915.2153.img解包 路径: 高级(Advancing) > 固件(firmware) > 解包(unpacking)得到\Output\Android\Image boot.imguboot.imgsuper.img 处理boot.…

前端人之网络通信概述

前端人之网络通信概述 介绍网络七层模型物理层链路层网络层传输层应用层 介绍 互联网的核心技术就是一系列协议&#xff0c;总称“互联网协议”&#xff0c;对电脑如何连接和组网作出详细的规定&#xff0c;理解了这些协议就理解了互联网的原理。 网络七层模型 互联网完成数…

Kafka节点服役和退役

1 服役新节点 1&#xff09;新节点准备 &#xff08;1&#xff09;关闭 bigdata03&#xff0c;进行一个快照&#xff0c;并右键执行克隆操作。 &#xff08;2&#xff09;开启 bigdata04&#xff0c;并修改 IP 地址。 vi /etc/sysconfig/network-scripts/ifcfg-ens33修改完…

【Qt实现虚拟键盘】

Qt实现虚拟键盘 &#x1f31f;项目分析&#x1f31f;实现方式&#x1f31f;开发流程 &#x1f31f;项目分析 需求&#xff1a;为Linux环境下提供可便捷使用的虚拟键盘OS环境&#xff1a;Windows 7/11、CentOS 7开发语言&#xff1a;Qt/C IDE&#xff1a;QtCreator 、Qt5.14.2功…