Python 将 CSV 分割成多个文件

news/2024/11/14 17:28:42/

文章目录

    • 使用 Pandas 在 Python 中创建 CSV 文件
    • 在 Python 中将 CSV 文件拆分为多个文件
      • 根据行拆分 CSV 文件
      • 根据列拆分 CSV 文件
    • 总结


在本文中,我们将学习如何在 Python 中将一个 CSV 文件拆分为多个文件。 我们将使用 Pandas 创建一个 CSV 文件并将其拆分为多个其他文件。


使用 Pandas 在 Python 中创建 CSV 文件

要使用 Pandas 在 Python 中创建 CSV,必须首先通过命令行界面 (CLI) 安装 Pandas。

pip install pandas

此命令将下载 Pandas 并将其安装到您的本地计算机中。 使用 import 关键字,您可以轻松地将其导入到您当前的 Python 程序中。

让我们验证 Pandas 是否已安装。

代码示例:

import pandas as pd
print("The Version of Pandas is: ", pd.__version__)

输出:

The Version of Pandas is: 1.3.5

现在,让我们创建一个 CSV 文件。

代码示例:

import pandas as pd# create a data set
data_dict = {'Roll no':    [1, 2, 3, 4, 5, 6, 7, 8],'Gender': ["Male", "Female", "Female", "Male","Male", "Female", "Male", "Female"],'CGPA':       [3.5, 3.3, 2.7, 3.8, 2.4, 2.1, 2.9, 3.9],'English':     [76, 77, 85, 91, 49, 86, 66, 98],'Mathematics': [78, 87, 54, 65, 90, 59, 63, 89],'Programming': [99, 45, 68, 85, 60, 39, 55, 88]}# create a data frame
data = pd.DataFrame(data_dict)# convert the data frame into a csv file
data.to_csv("studesnts.csv")# Print the output
print(data)

输出:

   Roll no  Gender  CGPA  English  Mathematics  Programming
0        1    Male   3.5       76           78           99
1        2  Female   3.3       77           87           45
2        3  Female   2.7       85           54           68
3        4    Male   3.8       91           65           85
4        5    Male   2.4       49           90           60
5        6  Female   2.1       86           59           39
6        7    Male   2.9       66           63           55
7        8  Female   3.9       98           89           88

在 Python 中将 CSV 文件拆分为多个文件

我们已经成功创建了一个 CSV 文件。 让我们将其拆分为多个文件,但可以使用不同的矩阵在列或行的基础上拆分 CSV。

根据行拆分 CSV 文件

让我们在 Python 中基于行拆分 CSV 文件。

代码示例:

import pandas as pd# read DataFrame
data = pd.read_csv("students.csv")# number of csv files along with the row
k = 2
size = 4for i in range(k):df = data[size*i:size*(i+1)]df.to_csv(f'students{i+1}.csv', index=False)file1 = pd.read_csv("students1.csv")
print(file1)
print("\n")
file2 = pd.read_csv("students2.csv")
print(file2)

输出:

      Roll no  Gender  CGPA  English  Mathematics  Programming
0        1    Male     3.5       76           78           99
1        2    Female   3.3       77           87           45
2        3    Female   2.7       85           54           68
3        4    Male     3.8       91           65           85Roll no  Gender  CGPA  English  Mathematics  Programming
4        5   Male     2.4       49           90           60
5        6   Female   2.1       86           59           39
6        7   Male     2.9       66           63           55
7        8   Female   3.9       98           89           88

上面的代码将 students.csv 文件拆分为两个多文件,student1.csv 和 student2.csv。 文件按行分隔; 第 0 到 3 行存储在 student.csv 中,第 4 到 7 行存储在 student2.csv 文件中。

根据列拆分 CSV 文件

借助 groupby() 函数,我们可以根据列矩阵拆分任何 CSV 文件。 groupby() 函数属于 Pandas 库,使用分组数据。

在这种情况下,我们根据性别对学生数据进行分组。

代码示例:

import pandas as pd# read DataFrame
data = pd.read_csv("students.csv")for (gender), group in data.groupby(['Gender']):group.to_csv(f'{gender} students.csv', index=False)print(pd.read_csv("Male students.csv"))
print("\n")
print(pd.read_csv("Female students.csv"))

输出:

       Roll no  Gender  CGPA  English  Mathematics  Programming
0        1      Male   3.5       76           78           99
1        4      Male   3.8       91           65           85
2        5      Male   2.4       49           90           60
3        7      Male   2.9       66           63           55Roll no  Gender  CGPA  English  Mathematics  Programming
0        2      Female   3.3       77           87           45
1        3      Female   2.7       85           54           68
2        6      Female   2.1       86           59           39
3        8      Female   3.9       98           89           88

总结

拆分数据是一种有用的数据分析技术,有助于理解和有效地排序数据。

在本文中,我们讨论了如何使用 Pandas 库创建 CSV 文件。 此外,我们还讨论了两种常见的数据拆分技术,行式数据拆分和列式数据拆分。


http://www.ppmy.cn/news/241441.html

相关文章

PC端品优购电商项目源码

品优购首页&#xff1a; 手机商品栏页面&#xff1a; 品优购注册页&#xff1a; 品优购首页项目源码&#xff1a; <!DOCTYPE html> <html lang"zh-CN"><head><meta charset"UTF-8"><meta http-equiv"X-UA-Compatible&qu…

Vue.js 中的数据请求是什么?如何进行数据请求?

Vue.js 中的数据请求是什么&#xff1f;如何进行数据请求&#xff1f; Vue.js 是一款流行的前端框架&#xff0c;它提供了许多方便的工具和 API&#xff0c;用于构建交互式的用户界面。其中&#xff0c;数据请求是 Vue.js 中重要的一部分&#xff0c;它可以让我们从服务器获取…

深度学习技巧应用18-OFD格式文件与人工智能结合的技巧应用,实现OFD转文本、OFD自动分类与内容提取

大家好,我是微学AI,今天给大家介绍一下深度学习技巧应用18-OFD格式文件与人工智能结合的技巧应用,实现OFD转文本、OFD自动分类与内容提取。OFD格式文件被称为“中国版PDF”。它与PDF格式类似,是一种可读、可打印、可编辑、可存档的电子文档格式,但OFD格式相对于PDF格式更加…

毕业2年,月薪就有30K,太卷了吧......

想起两年前交流过的一个应届生&#xff0c;当时他刚毕业技术水平不高&#xff0c;进了一个小公司做软件测试实习工作。最近联系上了&#xff0c;不问不知道&#xff0c;一问吓一跳&#xff0c;他现在已经进了某一线大厂&#xff0c;月薪30K。这位朋友其实也没比别人强多少&…

typeORM报 QueryFailedError: Data truncated for column ‘role‘ at row 3

typeORM报 QueryFailedError: Data truncated for column ‘role’ at row 3 今天博主在拉下项目后配置完数据库文件后发现TypeORM连接不上数据库。紧接着报QueryFailedError: Data truncated for column role at row 3这个错误。 这个问题一出来&#xff0c;必须得把锅推给T…

vue制作自己的组件库(仿ElementUI)

1.首先自己创建个新的vue项目&#xff0c;之后更改下目录形式&#xff0c;将src文件更改为examples&#xff0c;这里是专门放组件展示的md文件&#xff0c;packages文件里是放自己写的组件代码 2.然后是开始配置vue.config.js文件 &#xff0c;其中md-loader是读取md文件的相关…

代驾平台怎么运营朋友圈

时代飞速发展的今天&#xff0c;人们的生活水平不断提高&#xff0c;酒局饭局日渐增多&#xff0c;代驾这个新兴行业发展前景一片大好&#xff0c;对于代驾平台怎么运营朋友圈更是一筹莫展&#xff0c;针对这一些情况&#xff0c;指针跃动今天就来说说。 对于朋友圈的运营&…

UNIX域套接字

一、UNIX域流式套接字 1.本地地址 struct sockaddr_un { unsigned short sun_family; /* 协议类型 */ char sun_path[108]; /* 套接字文件路径 */ }; 2.UNIX域流式套接字 UNIX 域流式套接字的用法和TCP套接字基本一致&#xff0c;区别在于使用的协议和地址不同 …