python爬虫(7)之pandas模块

news/2025/2/15 15:53:05/

1、pandas模块里的两个对象

1、Series 对象

series很类似于一维数组但是它相较于数组多了行标签

示例代码:

import pandas as pd

ac =pd.Series([[1,2,8,9],[3,5,5,8]])

print(ac)

结果如下:

当然也可以更改行标签

示例如下:

import pandas as pd

ac =pd.Series([[1,2,8,9],[3,5,5,8]],index = ['a1','a2'])

print(ac)

结果如下:

当然也可以像是字典那样去创建Series对象,其中字典的键对应行标签

代码如下:

import pandas as pd

ac =pd.Series({'a1':'[1,2,8,9]','a2':'[3,5,5,8]'})

print(ac)

结果如下:

2、DataFrame对象

DataFrame 对象比前面所提到的Series对象用途更加宽泛,所以说后面尽量都来使用DataFrame来展开

代码示例:

import pandas as pd

i = pd.DataFrame([['数学',98],['语文',57]],columns=['学科','成绩'],index = ['a1','a2'])

print(i)

其中columns表示列标签 index表示行标签

结果如下:

2、读取Excel数据

1、读取工作表的数据

pd.read_excel()

代码示例如下:

import pandas as pd

import matplotlib.pyplot  as plt

data_1 = pd.read_excel('E:\desktop\橙仙的仙子梦想\附件2.xlsx', sheet_name=0)

plt.rcParams['font.sans-serif'] = ['SimHei']  

plt.rcParams['axes.unicode_minus'] = False

plt.rcParams['font.sans-serif'] = ['SimHei']

plt.rcParams['axes.unicode_minus'] = False

data_2 = data_1[data_1['是否打折销售'] =='否']

data_3 = data_2.shape

data_4  =data_1[data_1['是否打折销售'] =='是']

data_5 = data_4.shape

x = [ '不打折','打折']

y = [data_3[0],data_5[0]]

plt.bar(x,y,width= 0.1,color = 'pink' )

plt.title(label= "打折",loc= 'center')

plt.show()

结果如下:

注意:要将我得目录链接进行更改,明确自己的表的位置,使用相对路径,明确自己电脑的字体设置,要不然会报错。

2、指定读取数据的列标签和行标签

data_1 = pd.read_excel('E:\desktop\橙仙的仙子梦想\附件2.xlsx', sheet_name=0,header=0)

data_1 = pd.read_excel('E:\desktop\橙仙的仙子梦想\附件2.xlsx', sheet_name=0,index_col = 1)

其中header表示列标签(从零开始,这里若为None则会将列标签设置为从零开始)从某列开始读,index_col 表示行标签(也是从零开始)从某行开始读


 


http://www.ppmy.cn/news/1380314.html

相关文章

理解文件系统

个人主页:Lei宝啊 愿所有美好如期而遇 磁盘 磁盘的机械构成 磁盘的物理存储 每个磁盘的盘面,磁头,扇面,扇区都有唯一的编号,同时,一个扇区的大小是512字节(扇区的大小也有4KB的,或…

Java SE String类(一):常用方法(上)

1. 常用方法 1.1 字符串构造 String类的常用构造方法只有以下三种 public class Main {public static void main(String[] args) {String s1 "hello";//使用常量串进行构造String s2 new String("hello");//创建String对象char[] array {h,e,l,l,o};…

python的数据容器--字符串

字符串的取值 my_str "my name is zhou jie lun" valuemy_str[2] value2my_str[-10]print(f"从字符串{my_str}取下标为2的元素{value} 倒数16的值是{value2}")字符串的index查找方法 valmy_str.index("is") print(f"{val}")字符串的…

MonkeyRunner在自动化测试里的应用场景!

MonkeyRunner是Android提供的一个自动化测试工具,主要用于对Android设备或模拟器进行功能和压力测试。以下是一些MonkeyRunner在自动化测试中的应用场景及实例代码: 基本操作测试 点击屏幕上的特定位置或元素。 模拟滑动和手势操作。 发送按键事件。 …

2023年第三届中国高校大数据挑战赛第二场赛题D题赛题:行业职业技术培训能力评价(成品论文 代码与思路 视频讲解)

赛题 中国是制造业大国,产业门类齐全,每年需要培养大量的技能娴熟的技术工人进入工厂。某行业在全国有多所不同类型(如国家级、省级等)的职业技术培训学校,进行 5 种技能培训。学员入校时需要进行统一的技能考核&…

C语言函数—库函数

函数是什么? 数学中我们常见到函数的概念。但是你了解C语言中的函数吗? 维基百科中对函数的定义:子程序 在计算机科学中,子程序(英语:Subroutine, procedure, function, routine, method, subprogram, ca…

八股文-持续更新......

文章目录 SpringSpringBootDubboMQMysqlNettyRedis并发ZookeeperMybatisElasticsearchLinux微服务ZookeeperMybatisElasticsearchLinux

day1-C++

1>提示并输入一个字符串&#xff0c;统计该字符中大写、小写字母个数、数字个数、空格个数以及其他字符个数要求使用C风格字符串完成。 代码&#xff1a; #include <iostream> #include <string.h> using namespace std;int main() {string str ;int low 0, …