【愚公系列】《Python网络爬虫从入门到精通》028-DataFrame对象

news/2025/2/25 4:24:20/
标题详情
作者简介愚公搬代码
头衔华为云特约编辑,华为云云享专家,华为开发者专家,华为产品云测专家,CSDN博客专家,CSDN商业化专家,阿里云专家博主,阿里云签约作者,腾讯云优秀博主,腾讯云内容共创官,掘金优秀博主,亚马逊技领云博主,51CTO博客专家等。
近期荣誉2022年度博客之星TOP2,2023年度博客之星TOP2,2022年华为云十佳博主,2023年华为云十佳博主,2024年华为云十佳博主等。
博客内容.NET、Java、Python、Go、Node、前端、IOS、Android、鸿蒙、Linux、物联网、网络安全、大数据、人工智能、U3D游戏、小程序等相关领域知识。
欢迎👍点赞、✍评论、⭐收藏

文章目录

  • 🚀前言
  • 🚀一、DataFrame对象
    • 🔎1 图解DataFrame
    • 🔎2 创建DataFrame对象
      • 🦋2.1 通过二维数组创建
      • 🦋2.2 通过字典创建
    • 🔎3 DataFrame的重要属性和函数
      • 🦋3.1 核心属性
      • 🦋3.2 常用函数
    • 🔎4.示例代码及输出
      • 🦋4.1 查看前3行数据
      • 🦋4.2 查看统计信息
      • 🦋4.3 查看数据类型
    • 🔎5.注意事项


🚀前言

在数据分析与处理的世界中,Pandas库因其强大的数据处理能力而备受推崇。而在Pandas中,DataFrame对象作为其核心数据结构之一,以其灵活性和易用性成为数据科学家和分析师的得力助手。DataFrame不仅可以存储异构数据,还提供了丰富的操作功能,使得数据的清洗、处理和分析变得直观而高效。

🚀一、DataFrame对象

DataFrame 是 Pandas 中最核心的数据结构,它是一个二维表格型数据,由行索引(index)和列索引(columns)共同标识数据,类似于 Excel 表格或 SQL 表。

🔎1 图解DataFrame

DataFrame 可以看作是由多个 Series 组成的字典(共享相同的行索引),每个列是一个 Series。
示例:学生成绩表

在这里插入图片描述

  • 结构特点:
    • 每列可以是不同的数据类型(数值、字符串、布尔等)。
    • 支持灵活的行列操作(增删改查)。

案例:输出成绩表的每一列数据

python">import pandas as pd
#解决数据输出时列名不对齐的问题
pd.set_option('display.unicode.east_asian_width', True)
data = [[110,105,99],[105,88,115],[109,120,130]]
index = [0,1,2]
columns = [

http://www.ppmy.cn/news/1574760.html

相关文章

servlet化学实验交流平台-计算机设计毕业源码13069

目录 摘要 Abstract 第一章 绪论 1.1 选题背景及意义 1.2 国内外研究现状 1.3 研究方法 第二章 相关技术介绍 2.1 Java编程语言 2.2 B/S模式 2.3 MySQL简介 2.4 Serrvlet框架 2.5 Vue介绍 第三章 化学实验交流平台分析 3.1 系统目标 3.2 可行性分析 3.2.1 技术可…

Docker教程(喂饭级!)

如果你有跨平台开发的需求,或者对每次在新机器上部署项目感到头疼,那么 Docker 是你的理想选择!Docker 通过容器化技术将应用程序与其运行环境隔离,实现快速部署和跨平台支持,极大地简化了开发和部署流程。本文详细介绍…

车载DoIP协议 --- TCP详细解析

我是穿拖鞋的汉子,魔都中坚持长期主义的汽车电子工程师。 老规矩,分享一段喜欢的文字,避免自己成为高知识低文化的工程师: 简单,单纯,喜欢独处,独来独往,不易合同频过着接地气的生活…

力扣-回溯-78 子集

思路 根据子集的定义可以得到符合条件的子集应该是在树枝节点和叶子节点上都需要收集结果 代码 class Solution { public:vector<int> path;vector< vector<int> > result;void backtracking(vector<int> nums, int startIndex){result.push_back(…

【Python爬虫(41)】消息队列:分布式爬虫的“智慧中枢”

【Python爬虫】专栏简介&#xff1a;本专栏是 Python 爬虫领域的集大成之作&#xff0c;共 100 章节。从 Python 基础语法、爬虫入门知识讲起&#xff0c;深入探讨反爬虫、多线程、分布式等进阶技术。以大量实例为支撑&#xff0c;覆盖网页、图片、音频等各类数据爬取&#xff…

Deepin(Linux)设置开机自动启动 MySQL

要在系统启动时自动启动 MySQL&#xff0c;可以通过配置 systemd 来实现。由于已经完成了 MySQL 的安装并且能够启动 MySQL 服务&#xff0c;接下来我们将创建一个 systemd 服务单元文件&#xff0c;让 MySQL 在系统启动时自动启动。 1. 创建 systemd 服务文件 首先&#xff…

Qt 中的QMainWindow、QWidget 和 QDialog 基类

在 Qt 中&#xff0c;QMainWindow、QWidget 和 QDialog 都是非常重要的基类&#xff0c;它们在 GUI 开发中有着不同的用途和特点&#xff0c;下面为你详细介绍&#xff1a; 1. QWidget 简介 QWidget 是所有用户界面对象的基类&#xff0c;被称为基础窗口部件。在 Qt 的控件层…

便携式动平衡仪Qt应用层详细设计方案(基于Qt Widgets)

便携式动平衡仪Qt应用层详细设计方案&#xff08;基于Qt Widgets&#xff09; 版本&#xff1a;1.0 日期&#xff1a;2023年10月 一、系统概述 1.1 功能需求 开机流程&#xff1a;长按电源键启动&#xff0c;全屏显示商标动画&#xff08;快闪3~4次&#xff09;。主界面&…