【pandas 不同文件读取和存储】

news/2024/11/24 5:44:19/

文章目录

  • 一、Pandas 文件读取和存储概览
  • 二、读取不同类型的文件
    • 1. CSV文件的读取与存储
      • 代码及解释:
    • 2. Excel文件的读取与存储
      • 代码及解释:
    • 3. JSON文件的读取与存储
      • 代码及解释:
    • 4. SQL数据库的读取与存储
      • 代码及解释:
    • 5. 其他格式文件的读取与存储
      • HTML文件的读取
      • HDF5文件的读取和写入

一、Pandas 文件读取和存储概览

Pandas 支持的文件类型包括但不限于 CSV、Excel、JSON、HTML 和 SQL。

二、读取不同类型的文件

1. CSV文件的读取与存储

CSV(逗号分隔值)文件是数据存储的一种常见格式,特别适合存储表格数据。

代码及解释:

import pandas as pd# 读取CSV文件
data_csv = pd.read_csv('example.csv')
print(data_csv.head())# 存储为CSV文件
data_csv.to_csv('output.csv', index=False)

pd.read_csv 函数用于读取 CSV 文件,而 to_csv 方法用于将 DataFrame 存储回 CSV 文件。index=False 参数防止将行索引作为单独一列写入文件。

2. Excel文件的读取与存储

Excel 文件是办公室中常用的数据记录和分析工具。Pandas 通过内置的函数支持读取和写入 Excel 文件。

代码及解释:

# 读取Excel文件
data_excel = pd.read_excel('example.xlsx')
print(data_excel.head())# 存储为Excel文件
data_excel.to_excel('output.xlsx', index=False)

pd.read_excelto_excel 分别用于读取和写入 Excel 文件。同样,index=False 防止行索引被写入。

3. JSON文件的读取与存储

JSON(JavaScript Object Notation)是一种轻量级的数据交换格式,常用于网络数据传输。

代码及解释:

# 读取JSON文件
data_json = pd.read_json('example.json')
print(data_json.head())# 存储为JSON文件
data_json.to_json('output.json')

pd.read_json 用于读取 JSON 文件,而 to_json 方法将 DataFrame 转换为 JSON 格式。

4. SQL数据库的读取与存储

SQL 数据库是存储和管理数据的重要工具。Pandas 可以与 SQL 数据库交互,执行数据的读取和存储操作。

代码及解释:

from sqlalchemy import create_engine# 创建数据库连接
engine = create_engine('sqlite:///example.db')# 读取SQL数据
data_sql = pd.read_sql('SELECT * FROM table_name', engine)
print(data_sql.head())# 存储到SQL数据库
data_sql.to_sql('table_name', engine, if_exists='replace', index=False)

在这里,create_engine 用于创建与数据库的连接。pd.read_sql 从数据库中读取数据,而 to_sql 方法将数据写入数据库。

5. 其他格式文件的读取与存储

除了上述格式,Pandas 还支持多种其他格式,例如 HTML、HDF5 等。

HTML文件的读取

# 读取HTML中的表格数据
data_html = pd.read_html('http://example.com')
print(data_html[0].head())

pd.read_html 读取 HTML 文件中的表格数据。

HDF5文件的读取和写入

# 读取HDF5文件
data_hdf5 = pd.read_hdf('data.h5', 'key')
print(data_hdf5.head())# 写入HDF5文件
data_hdf5.to_hdf('output.h5', 'key')

HDF5 是用于存储大量科学数据的一种文件格式。pd.read_hdfto_hdf 分别用于读取和写入 HDF5 文件。


http://www.ppmy.cn/news/1353754.html

相关文章

阿里云服务器ECS租赁费用报价_CPU内存_带宽和系统盘价格表

2024年最新阿里云服务器租用费用优惠价格表,轻量2核2G3M带宽轻量服务器一年61元,折合5元1个月,新老用户同享99元一年服务器,2核4G5M服务器ECS优惠价199元一年,2核4G4M轻量服务器165元一年,2核4G服务器30元3…

社区养老|社区养老服务系统|基于springboot社区养老服务系统设计与实现(源码+数据库+文档)

社区养老服务系统目录 目录 基于springboot社区养老服务系统设计与实现 一、前言 二、系统功能设计 三、系统实现 1、管理员部分功能 (1) 用户管理 (2)服务种类管理 (3)社区服务管理 &#xff08…

信息安全性测试

1 信息安全性测试 信息安全性测试是确保产品或系统能够有效地保护信息和数据,使得用户、其他产品或系统的访问权限与其授权类型和级别相一致的一系列检查过程。信息安全性测试也应该是一个持续的过程,确保信息系统能够抵御恶意攻击,并保护数…

django通过指定用户手机号查询外键所关联的数据,倒序查询

django通过指定用户手机号查询外键所关联的数据 在Django中,可以通过使用filter方法和双下划线语法来查询外键所关联的数据。以下是一种常见的方法: from your_app.models import User, ForeignKeyModel# 假设User模型有一个名为phone的字段&#xff…

[BIZ] - 1.金融交易系统特点

1. 典型数据汇总 数据 说明 新增数据量(条/天) Qps(条/s) 消息大小(Byte) 实时性 可丢失性 可恢复性 实时行情 1.使用场景:交易,报价,策略验证; 2.冷热分离:彭博行情/其他行情;黄金&期货行情/…

Docker 第十四章 : Docker 三剑客之 Machine

第十四章 : Docker 三剑客之 Machine 本章知识点: Docker Machine 是 Docker 三剑客之一,它是一个工具,允许用户在本地或远程机器上创建 Docker 主机。它简化了 Docker 环境的设置,特别是在不同的操作系统和云平台上。通过 Docker Machine,用户可以轻松地在虚拟机或物理…

shell脚本练习题

1.输入字符,判断字符类型 #!/bin/bash read -p "字符" word case $word in[[:upper:]])echo "大写字母";;[[:lower:]])echo "小写字母";;[0-9])echo "数字";; esac2输入年月,判断该月有多少天 #!/bin/bash re…

npm报错之package-lock.json found. 问题和淘宝镜像源过期问题

1、package-lock.json found. 问题的解决 在执行yarn add react-transition-group -S 安装react-transition-group时出现package-lock.json found. Your project contains lock files generated by tools other than Yarn. It is advised not to mix package managers in orde…