使用Python及R语言绘制简易数据分析报告

server/2024/10/19 1:29:25/
Pytohn实现

  在python中有很多包可以实现绘制数据分析报告的功能,推荐两个较为方便的包:pandas-profiling 和 sweetviz 。

使用 pandas-profiling 包(功能全面)

    这个包的个别依赖包与机器学习的 sklearn 包的依赖包存在版本冲突,如已安装sklearn包的话可以在Anaconda中创建虚拟环境使用。

在Anaconda中创建python虚拟环境(创建了一个3.6版本,名为GGBoy的python虚拟环境):

conda create -n GGBoy python=3.6

Proceed([y]/n)? 中选择 y 

创建虚拟环境成功后激活虚拟环境:

conda activate GGBoy

 环境激活成功:

(GGBoy) C:\Users\114514>

在虚拟环境中安装pandas包和pandas-profiling包:

conda install pandas
pip install pandas-profiling

 绘制titandick数据集的数据报告,数据集下载地址:taitanic | Kaggle

在VSCode中建立一个拓展名.ipynb的jupyter notebook文件,内核选择刚才新建的虚拟环境:

 使用 pandas-profiling 包:

python">from pandas_profiling import ProfileReport
import pandas as pd# 使用pandas读取titandick的csv数据集
data = pd.read_csv('C:\\Users\\114514\\Desktop\\titandick.csv')
df = pd.DataFrame(data)# 绘制数据分析报告
report = ProfileReport(df)  
report.to_file(output_file='report.html')

 生成报告:

使用 sweetviz 包(最方便操作):

python">import sweetviz as sv
import pandas as pd# 使用pandas读取titandick的csv数据集
data = pd.read_csv('C:\\Users\\114514\\Desktop\\titandick.csv')
df = pd.DataFrame(data)# 使用sweetviz包绘制数据分析报告
report = sv.analyze(df) 
report.show_html('report.html')

生成报告:

R语言实现

 需要先下载R包 summarytools :

install.packages("summarytools")
library(summarytools)df <- read.csv("C:/Users/114514/Desktop/titandick.csv")
report <- dfSummary(df)  html_report <- print(report, method = "render", include.row.numbers = FALSE, style = "grid")  html_output <- paste(html_report, collapse = "\n")  # 将合并后的HTML字符串写入文件  
cat(html_output, file = "report_GGBoy.html")

 生成的数据分析报告:


http://www.ppmy.cn/server/28680.html

相关文章

网络安全思考题

1.windows登录的明文密码&#xff0c;存储过程是怎么样的&#xff0c;密文存在哪个文件下&#xff0c;该文件是否可以打开&#xff0c;并且查看到密文&#xff1f; 存储Windows登录的密码通常是加密存储的&#xff0c;而不是以明文形式存储。Windows使用的是NTLM或者Kerberos等…

【经典算法】LeetCode 108. 将有序数组转换为二叉搜索树(Java/C/Python3/Go实现含注释说明,Easy)

目录 题目描述思路及实现方式一&#xff1a;递归中值法思路代码实现Java版本C语言版本Python3版本Golang版本 复杂度分析 方式二&#xff1a;迭代法思路代码实现Java实现Python实现C实现Go版本 复杂度分析总结 总结相似题目 标签(题目类型)&#xff1a;树&#xff0c;二叉搜索树…

如何用二维码实现现代仓库管理?

随着科技的进步&#xff0c;二维码技术逐渐应用与各个领域&#xff0c;其中在仓库管理中的应用也日益广泛。 那话不多说&#xff0c;我们直接来看如何用二维码实现现代仓库管理 简道云仓库管理模板&#xff0c;可以点击安装配合阅读&#xff1a;https://www.jiandaoyun.com 二…

JavaScript(五)

JavaScript运算符 JavaScript 提供了多种运算符&#xff0c;用于在代码中执行各种操作。以下是一些主要的 JavaScript 运算符分类及其示例&#xff1a; 1. 算术运算符 加&#xff08;&#xff09;&#xff1a;两个数相加减&#xff08;-&#xff09;&#xff1a;第一个数减去…

设计模式之装饰者模式DecoratorPattern(四)

一、概述 装饰者模式&#xff08;Decorator Pattern&#xff09;是一种用于动态地给一个对象添加一些额外的职责的设计模式。就增加功能来说&#xff0c;装饰者模式相比生成子类更为灵活。装饰者模式是一种对象结构型模式。 装饰者模式可以在不改变一个对象本身功能的基础上增…

基于Springboot的爱心商城系统(有报告)。Javaee项目,springboot项目。

演示视频&#xff1a; 基于Springboot的爱心商城系统&#xff08;有报告&#xff09;。Javaee项目&#xff0c;springboot项目。 项目介绍&#xff1a; 采用M&#xff08;model&#xff09;V&#xff08;view&#xff09;C&#xff08;controller&#xff09;三层体系结构&…

C++——数据类型笔记

在C编程中&#xff0c;了解各类数据类型也是至关重要的。下面我会总结一下C中的数据类型&#xff0c;包括基本类型&#xff0c;符合类型和自定义类型。方便自己整理和理解。 &#xff11;&#xff0c;基本类型 C中的基本类型是构建其他数据类型的基础&#xff0c;常见的基础类…

postman一直转圈圈,无法启动

解决 地址栏输入%appdata%进入此目录&#xff0c;删除%appdata%目录下的postman文件可以解决问题。