python生成词云图

news/2024/10/20 21:28:49/

生成词云图的话需要先对数据进行分词处理 , 分词方法点击查看

python">
import pandas as pd
from collections import Counter
from wordcloud import WordCloud
import matplotlib.pyplot as plt# 假设您已经按照之前的步骤处理了数据,并且处理后的数据保存在'comments_processed.csv'文件中
# 读取处理后的数据
df = pd.read_csv('comments_processed.csv', encoding='utf-8-sig')# 假设处理后的词汇存储在'connected_words'列中
words = ' '.join(df['connected_words'].values)
cleaned_stt = ' '.join(words.strip().split())# 使用 split() 方法将字符串分割为列表
word_list = cleaned_stt.split(' ')
word_counts = Counter(word_list)# 提取前20个高频词(如果词的数量少于20个,则提取所有)
top_words = word_counts.most_common(80)# 准备用于生成词云的数据
# 将高频词和它们的词频分开
top_words_list, top_words_freq = zip(*top_words)# 将词频列表转换为字典,用于wordcloud的权重参数
word_freq_dict = dict(top_words)
word_freq_dict1 = {'性能': 3351, '外观': 1086, '舒适': 806, '环保': 591, '智能': 433, '越野': 416, '坐在': 400, '前排': 389, '东西': 367, '拥挤': 360, '座椅': 338, '很大': 305, '储物': 304, '不错': 303, '车子': 277, '足够': 266, '腿部': 263, '舒服': 242, '设计': 238, '车内': 231}
word_freq_dict.update(word_freq_dict1)
print(word_freq_dict)
# 创建词云对象,并指定字体(确保支持中文)
wordcloud = WordCloud(width=1200, height=800, background_color='white',font_path=fr'fonts\xiawuxiheixinban.ttf'  # 或者其他支持中文的字体文件路径).generate_from_frequencies(word_freq_dict)# 显示词云图
plt.figure(figsize=(8, 8), facecolor=None)
plt.imshow(wordcloud, interpolation="bilinear")
plt.axis("off")
plt.tight_layout(pad=0)plt.show()

http://www.ppmy.cn/news/1464906.html

相关文章

linux 常用命令:find grep ps netstat sudo df du rm

rm 命令 删除 -r 是递归参数(recursive),用于删除目录及其内容。如果不加这个参数,rm 命令无法删除非空目录。-f 是强制参数(force),用于强制删除文件或目录,不会进行任何确认提示…

【iOS】——工厂设计模式

文章目录 一、设计模式创建型模式结构型模式行为型模式 二、设计模式七大准则三、简单工厂模式四、工厂方法模式五、抽象工厂模式 一、设计模式 设计模式是指在特定上下文中解决常见问题时所采用的一套可复用的解决方案。这些模式是面向对象编程中的通用概念,广泛应…

vue3中el-form表单校验,再点击提交按钮的时候通过校验才进行提交

vue3中el-form表单校验&#xff0c;再点击提交按钮的时候通过校验才进行提交 一、前言1、案例 一、前言 在 Vue 3 中&#xff0c;可以使用 Element UI 的 <el-form> 组件配合 <el-form-item> 来实现表单的必填项校验&#xff0c;并在提交时根据校验结果来决定是否…

去除字符串中的空格和特殊字符

自学python如何成为大佬(目录):https://blog.csdn.net/weixin_67859959/article/details/139049996?spm1001.2014.3001.5501 用户在输入数据时&#xff0c;可能会无意中输入多余的空格&#xff0c;或在一些情况下&#xff0c;字符串前后不允许出现空格和特殊字符&#xff0c;…

数据库漫谈-MySQL

MySQL的发展大体上分为4个阶段&#xff1a; 1979-2000 业余开发阶段 2000年&#xff0c;MySQL AB公司在瑞典成立 2008年1月&#xff0c;MySQL AB公司被Sun公司以10亿美金收购。 2009年4月&#xff0c;Oracle公司以74亿美元收购Sun公司 免费好用是MySQL的最…

玄机应急响应-Linux日志分析

1、有多少IP在爆破主机ssh的root帐号&#xff0c;如果有多个使用","分割 rootip-10-0-10-4:/var/log# cat auth.log.1 | grep -a "Failed password for root" | awk {print($11)} | uniq | sort 192.168.200.2 192.168.200.31 192.168.200.32 这段命令是…

CompletableFuture详细讲解

目录 一、基本概念 1.1 异步编程 1.2 CompletableFuture简介 二、创建和完成CompletableFuture 2.1 创建CompletableFuture对象 2.2 手动完成CompletableFuture 2.3 异常完成CompletableFuture 三、异步计算和回调 3.1 异步任务的执行 3.2 处理计算结果 四、组合多个…

代码随想录-Day22

235. 二叉搜索树的最近公共祖先 方法一&#xff1a;两次遍历 class Solution {public TreeNode lowestCommonAncestor(TreeNode root, TreeNode p, TreeNode q) {List<TreeNode> path_p getPath(root, p);List<TreeNode> path_q getPath(root, q);TreeNode anc…