pandas系列----DataFrame简介

news/2025/1/11 4:24:57/

DataFrame是Pandas库中最常用的数据结构之一,它是一个类似于二维数组或表格的数据结构。DataFrame由多个列组成,每个列可以是不同的数据类型(如整数、浮点数、字符串等)。每列都有一个列标签(column label),每行都有一个索引(index),使得我们可以通过标签或索引来访问和操作数据。我们可以使用多种方式来创建DataFrame,最常见的方式是从CSV文件、Excel文件、SQL数据库等外部数据源中读取数据。另外,我们也可以通过手动输入数据、从字典或列表中创建DataFrame。一旦创建了DataFrame,我们可以使用各种方法和函数来对数据进行操作。例如,我们可以进行数据的筛选、排序、合并、分组等操作,还可以进行统计分析、数据可视化等。总的来说,DataFrame是Pandas库中非常强大和灵活的数据结构,使得我们可以轻松地对数据进行处理、分析和可视化。

DataFrame是pandas库中用于处理和分析数据的重要数据结构。它可以被看作是一个二维的表格,类似于电子表格或SQL中的数据库表。

DataFrame的特点包括:

  1. 二维结构:DataFrame由行和列组成,可以像表格一样对数据进行操作和分析。

  2. 标签索引:每一个列和行都有一个唯一的标签索引,可以通过标签来引用和操作数据。

  3. 不同数据类型:DataFrame中的每一列可以是不同的数据类型,例如整数、浮点数、字符串等。

  4. 缺失值处理:DataFrame可以处理缺失值,可以使用NaN或None来表示缺失的数据。

  5. 灵活的操作:DataFrame可以进行多种灵活的操作,包括数据过滤、排序、统计、重塑等。

  6. 数据对齐:DataFrame可以根据标签自动对齐数据,使得操作更加方便。

DataFrame是pandas库中最常用的数据结构之一,提供了丰富的功能和方法,可以快速高效地处理和分析数据。

一、Dataframe的创建

DataFrame可以通过多种方式进行创建。下面列举了一些常见的创建DataFrame的方法:

1. 从CSV文件或Excel文件中读取数据

2. 从字典中创建DataFrame

3. 从列表中创建DataFrame

4. 手动创建DataFrame

1、从字典中创建DataFrame

        使用字典创建DataFrame是一种常见的方法。可以将字典中的每个键值对作为一列数据,通过pd.DataFrame()函数将字典转换为DataFrame对象。

2. 从CSV文件或Excel文件中读取数据

        可以使用pandas库中的read_csv()和read_excel()函数从CSV文件或Excel文件中读取数据,并创建DataFrame。传入参数为文件地址。

二、Dataframe切片

1、索引

df[[列名1,列名2...列名n]]    ——    其中n=[0,正无穷]

2、切片

2.1、行切片

        df[行索引1:行索引2]    ——    不包括行索引2

        df.loc[行索引1:行索引2]    ——    包括行索引2

2.2、列切片

        df.loc[:,'列名':'列名']

三、Dataframe方法

方法说明方法说明
min最小值max最大值
mean均值ptp极差
median中位数std标准差
var方差cov协方差
sem标准误差mode众数
skew样本偏度kurt样本峰度
quantile四分位数count非空值数
describe描述统计mad平均绝对离差


http://www.ppmy.cn/news/1562150.html

相关文章

【微服务】6、限流 熔断

线程隔离与容错处理 本视频主要讲解了在购物车业务中,因商品微服务响应慢导致的问题及解决方案,重点介绍了线程隔离后查询购物车业务不可用的情况,以及如何通过Fallback逻辑进行缓解,包括配置Feign调用为簇点资源、添加Fallback逻…

QT-TCP-server

为了实现高性能的TCP通讯&#xff0c;以下是一个基于Qt的示例&#xff0c;展示如何利用多个线程、非阻塞I/O、数据分块和自定义协议进行优化。该示例以TCP服务器和客户端的形式展示&#xff0c;能够承受高负载并实现快速数据传输。 高性能TCP Server示例 #include <QTcpSe…

算法5--位运算

目录 基础经典例题[面试题 01.01. 判定字符是否唯一](https://leetcode.cn/problems/is-unique-lcci/description/)[268. 丢失的数字](https://leetcode.cn/problems/missing-number/description/)[371. 两整数之和](https://leetcode.cn/problems/sum-of-two-integers/descrip…

Redis数据结构ZipList和QuickList原理解析

大家好&#xff0c;我是袁庭新。 在数据库的世界里&#xff0c;Redis 以其高效和灵活备受瞩目。而其中的 ZipList 和 QuickList 数据结构更是独具魅力。它们在内存管理和数据存储方面有着独特的设计理念&#xff0c;深入探究这些结构&#xff0c;能让我们更好地理解 Redis 的强…

(回溯法)leetcode39组合总和

第一个2开头&#xff0c;下面的子节点的集合元素均为2,5,3 但是在5开头&#xff0c;下面的子节点集合元素均为5,3 带着这个图的思路确定i和index的传递值 backtracking(i, nums,8,sum);用的是i而不是i1 // ConsoleApplication3.cpp : 此文件包含 "main" 函数。程序…

智能工厂的设计软件 应用场景的一个例子: 为AI聊天工具添加一个知识系统 之21 项目主页:基于资源的交互系统--以RESTful 风格设计构建 聊天窗口

本文要点 基于 RESTful 风格设计一个“为 AI 聊天工具添加一个知识树系统”的项目主页 本项目&#xff08;为AI聊天工具添加一个知识树系统&#xff09;的主页页面的三个页面版块( 注&#xff1a;一个项目的基础版本&#xff0c;它明确给出建模限制 what(where&#xff0c;ho…

嵌入式入门Day38

C Day1 第一个C程序C中的输入输出输出操作coutcin练习 命名空间使用方法自定义命名空间冲突问题 C对字符串的扩充C风格字符串的使用定义以及初始化C风格字符串与C风格字符串的转换C风格的字符串的关系运算常用的成员变量输入方法 布尔类型C对堆区空间使用的扩充作业 第一个C程序…

Selenium,一个Web自动化测试的Python库!

Selenium&#xff0c;一个Web自动化测试的Python库 大家好&#xff0c;我是景墨。今天咱们来聊聊一个超级实用的Python库&#xff1a;Selenium。这个库可以帮我们实现Web自动化测试&#xff0c;简直是测试工程师和爬虫开发者的神器&#xff01;保证学会了这个&#xff0c;你的…