介绍一个在数据分析中常用的函数:data.iloc[]

ops/2024/9/23 3:35:14/

平时处理数据集中,总是需要选中一些列的数据,去预测其他列的数据,所以data.iloc[],在数据分析中显得尤为方便。

介绍一下data.iloc[]

data.iloc[] 是 Python 中 pandas 库的一个非常有用的功能,它允许你通过行和列的整数位置索引来选择数据。iloc 是 “integer location” 的缩写,意味着你可以通过指定行和列的整数索引来选择数据,而不是使用标签。

以下是一些使用 data.iloc[] 的基本示例:

  1. 选择单个元素
    使用 data.iloc[row_index, column_index] 来选择特定的元素。

    element = data.iloc[0, 1]  # 选择第1行第2列的元素
    
  2. 选择一行
    使用 data.iloc[i,:] 来选择第 i 行的所有列。

    row = data.iloc[2, :]  # 选择第3行的所有列
    
  3. 选择一列
    使用 data.iloc[:, j] 来选择第 j 列的所有行。

    column = data.iloc[:, 1]  # 选择第2列的所有行
    
  4. 选择多个行和列
    使用 data.iloc[i:m, j:n] 来选择从第 i 行到第 m 行,第 j 列到第 n 列的数据。

    sub_data = data.iloc[0:3, 1:4]  # 选择第1行到第3行,第2列到第4列的数据
    
  5. 使用切片
    iloc 也支持 Python 的切片语法,可以用于选择行或列的范围。

    sub_data_rows = data.iloc[0:5:2, :]  # 选择第1行到第5行,步长为2的行
    sub_data_cols = data.iloc[:, 1:5:2]  # 选择第2列到第5列,步长为2的列
    
  6. 选择多个不连续的行或列
    使用数组或列表来选择多个不连续的行或列。

    selected_rows = data.iloc[[0, 2, 4], :]  # 选择第1、3、5行的所有列
    selected_cols = data.iloc[:, [1, 3]]     # 选择第2、4列的所有行
    

请注意,在使用 iloc 时,索引是从0开始的,即第一行或第一列的索引是0。此外,iloc 只能用于选择行和列,不能用于选择 DataFrame 中的标签(即列名或索引)。如果你需要基于标签选择数据,应该使用 loc 而不是 iloc

数据分析代码中的应用

这是在一个数据分析代码中的一部分,这里就用了iloc[]选取前两列作为特征数据,第三列作为目标变量(也就是通过前两列的值预测最后一列的数据)。

# 1. 数据加载
data = pd.read_csv('data.csv')
X = data.iloc[:, :2]  # 取前两列作为特征
y = data.iloc[:, 2]  # 取第三列作为目标变量# 2. 数据预处理
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
scaler = StandardScaler()
X_train_scaled = scaler.fit_transform(X_train)
X_test_scaled = scaler.transform(X_test)

http://www.ppmy.cn/ops/30230.html

相关文章

python 如何判断是函数还是方法 (function or method)

示例代码: def test_fn():passclass Test(object):staticmethoddef s_fn():passclassmethoddef c_fn(cls):passdef my_fn(self):pass如何判断是可调用的方法: hasattr(test_fn, __call__) # true hasattr(Test.s_fn, __call__) # true hasattr(Test.c…

ICode国际青少年编程竞赛- Python-1级训练场-基础训练1

ICode国际青少年编程竞赛- Python-1级训练场-基础训练1 1、 Dev.step(4)2、 Dev.step(-4) Dev.step(8)3、 Dev.turnLeft() Dev.step(4)4、 Dev.step(3) Dev.turnLeft() Dev.step(-1) Dev.step(4)5、 Dev.step(-1) Dev.step(3) Dev.step(-2) Dev.turnLeft() Dev.step(…

【云原生】Docker 实践(一):在 Docker 中部署第一个应用

Docker 实践(一):在 Docker 中部署第一个应用 1.使用 YUM 方式安装 Docker2.验证 Docker 环境3.在 Docker 中部署第一个应用3.1 小插曲:docker pull 报 missing signature key 错误3.2 重新安装 Nginx 1.使用 YUM 方式安装 Docker…

引领农业新质生产力,鸿道(Intewell®)操作系统助力农业机器人创新发展

4月27日至29日,2024耒耜国际会议在江苏大学召开。科东软件作为特邀嘉宾出席此次盛会,并为江苏大学-科东软件“农业机器人操作系统”联合实验室揭牌。 校企联合实验室揭牌 在开幕式上,江苏大学、科东软件、上交碳中和动力研究院、遨博智能研究…

Kafka如何将消息发送到指定分区

背景 面试一个时,面试官问了一个问题,Kafka如何做到顺序消息。我回答只给Kafka的Topic创建一个分区,发送到该Topic的消息在Kafka中就是有序的。 面试官又问,如果Topic有多个分区呢?我回答消息发送者在发送消息的时候…

【C语言实现贪吃蛇】(内含源码)

前言:首先在实现贪吃蛇小游戏之前,我们要先了解Win32 API的有关知识 1.Win32 API Windows这个多作业系统除了协调应用程序的执行、分配内存、管理资源之外,它同时也是一个很大的服务中心,调佣这个中心的各种服务(每一…

Python爬虫技术与数据可视化:Numpy、pandas、Matplotlib的黄金组合

前言 在当今信息爆炸的时代,数据已成为企业决策和发展的关键。而互联网作为信息的主要来源,网页中蕴含着大量的数据等待被挖掘。Python爬虫技术和数据可视化工具的结合,为我们提供了一个强大的工具箱,可以帮助我们从网络中抓取数…

selenium 4.20.0 访问外网问题

保存信息:There was an error managing chromedriver (error sending request for url (https://storage.googleapis.com/chrome-for-testing-public/124.0.6367.91/win64/chromedriver-win64.zip)); using driver found in the cache 报错原因:因为sel…