构建神经网络之常用pandas(补充中 )

devtools/2025/3/3 4:24:39/

1.serials:

ps=pandas.Series(data=None, index=None, dtype=None, name=None, copy=False, fastpath=False)
建议:封装一维数组就行了

2.DataFrame

import pandas as pd# 创建 DataFrame
data = {'Name': ['Alice', 'Bob', 'Charlie', 'David'],'Age': [25, 30, 35, 40],'City': ['New York', 'Los Angeles', 'Chicago', 'Houston']
}
df = pd.DataFrame(data)# 查看前两行数据
print(df.head(2))# 查看 DataFrame 的基本信息
print(df.info())# 获取描述统计信息
print(df.describe())# 按年龄排序
df_sorted = df.sort_values(by='Age', ascending=False)
print(df_sorted)# 选择指定列
print(df[['Name', 'Age']])# 按索引选择行
print(df.iloc[1:3])  # 选择第二到第三行(按位置)# 按标签选择行
print(df.loc[1:2])  # 选择第二到第三行(按标签)# 计算分组统计(按城市分组,计算平均年龄)
print(df.groupby('City')['Age'].mean())# 处理缺失值(填充缺失值)
df['Age'] = df['Age'].fillna(30)# 导出为 CSV 文件
df.to_csv('output.csv', index=False)

3 读写文件

1.csv


import pandas as pddf = pd.read_csv('nba.csv')print(df)nme = ["Google", "Runoob", "Taobao", "Wiki"]
st = ["www.google.com", "www.runoob.com", "www.taobao.com", "www.wikipedia.org"]
ag = [90, 40, 80, 98]# 字典
dict = {'name': nme, 'site': st, 'age': ag}df = pd.DataFrame(dict)# 保存 dataframe
df.to_csv('site.csv')

2.xlsx

import pandas as pd# 读取 data.xlsx 文件
df = pd.read_excel('runoob_pandas_data.xlsx')# 打印读取的 DataFrame
print(df)df = pd.DataFrame({
'Name': ['Alice', 'Bob', 'Charlie'],
'Age': [25, 30, 35],
'City': ['New York', 'Los Angeles', 'Chicago']
})# 将 DataFrame 写入 Excel 文件,写入 'Sheet1' 表单
df.to_excel('output.xlsx', sheet_name='Sheet1', index=False)# 写入多个表单,使用 ExcelWriter
with pd.ExcelWriter('output.xlsx') as writer:
df.to_excel(writer, sheet_name='Sheet1', index=False)
df.to_excel(writer, sheet_name='Sheet2', index=False)import pandas as pd# 使用 ExcelFile 加载 Excel 文件
excel_file = pd.ExcelFile('data.xlsx')# 查看所有表单的名称
print(excel_file.sheet_names)# 读取指定的表单
df = excel_file.parse('Sheet1')
print(df)# 关闭文件
excel_file.close()

4.数据清洗

1.处理缺失值:

删除 dropna

1.DataFrame.dropna(axis=0, how='any', thresh=None, subset=None, inplace=False)axis:默认为 0,表示逢空值剔除整行,如果设置参数 axis=1 表示逢空值去掉整列。
how:默认为 'any' 如果一行(或一列)里任何一个数据有出现 NA 就去掉整行,如果设置 how='all' 一行(或列)都是 NA 才去掉这整行。
thresh:设置需要多少非空值的数据才可以保留下来的。
subset:设置想要检查的列。如果是多个列,可以使用列名的 list 作为参数。
inplace:如果设置 True,将计算得到的值直接覆盖之前的值并返回 None,修改的是源数据。

2 填充充 fillna().

import pandas as pddf = pd.read_csv('property-data.csv')df.fillna(12345, inplace = True)print(df.to_string())

2.独热编码

无法处理数据串

df=pd.get_dummies(variable)


http://www.ppmy.cn/devtools/164092.html

相关文章

Python的那些事第三十四篇:基于 Plotly 的交互式图表与仪表板设计与应用

基于 Plotly 的交互式图表与仪表板设计与应用 摘要: 本文深入探讨了 Plotly 这一强大的交互式图表和仪表板库。首先介绍了 Plotly 的背景与发展历程,随后详细阐述了其核心功能特性,包括丰富的图表类型、高度的自定义能力以及便捷的交互操作。通过实际案例分析和示例代码展示…

【Java项目】基于Spring Boot的校园闲置物品交易网站

【Java项目】基于Spring Boot的校园闲置物品交易网站 技术简介:采用Java技术、Spring Boot框架、MySQL数据库等实现。 系统简介:校园闲置物品交易网站是一个典型的管理系统,主要功能包括管理员:首页、个人中心、用户管理、商品类…

安装 Windows Docker Desktop - WSL问题

一、关联文章: 1、Docker Desktop 安装使用教程 2、家庭版 Windows 安装 Docker 没有 Hyper-V 问题 3、打开 Windows Docker Desktop 出现 Docker Engine Stopped 问题 二、问题解析 打开 Docker Desktop 出现问题,如下: Docker Desktop - WSL update failed An error o…

el-tree实现双击树节点事件

el-tree组件本身并没有直接支持双击事件的属性或方法&#xff0c;我们可以借助外部函数实现。 主要思路&#xff1a;在短时间范围内&#xff0c;通过定时器来判断是否为双击 1.el-tree中使用组件的node-click事件 <el-tree:accordion"true"class"filter-tr…

百度百舸 DeepSeek 一体机发布,支持昆仑芯 P800 单机 8 卡满血版开箱即用

在私有云环境中成功部署 DeepSeek 满血版并实现性能调优&#xff0c;并不是一件容易的事情。选择合适的 GPU 配置、安装相应的环境、成功部署上线业务、加速推理任务加速、支撑多用户并发 …… 完成业务测试&#xff0c;成功融入生产业务中。 为了帮助企业快速实现 DeepSeek 服…

Spring Boot 整合 log4j2 日志配置教程

文章目录 前言一、常用日志框架二、配置参数介绍 1. 日志级别2. 输出形式3. 日志格式 3.1 PatternLayout 自定义日志布局 三、Log4j2 配置详解 1. 根节点 Configuration2. Appenders 节点 2.1 Console 节点2.2 File 节点2.3 RollingFile 节点 2.3.1 ThresholdFilter 节点2.3.…

C#实现文件MD5校验:保障数据完整性

主要介绍如何通过C#快速计算文件MD5值&#xff0c;适用于数据校验、文件比对等场景&#xff0c;提供完整代码解析与使用教程。 一、具体的使用场景 文件完整性验证 软件下载后对比原始MD5&#xff0c;防止文件损坏或被篡改云存储文件上传/下载时的数据一致性校验 重复文件识别…

51c自动驾驶~合集52

我自己的原文哦~ https://blog.51cto.com/whaosoft/13383340 #世界模型如何推演未来的千万种可能 驾驶世界模型&#xff08;DWM&#xff09;&#xff0c;专注于预测驾驶过程中的场景演变&#xff0c;已经成为追求自动驾驶的一种有前景的范式。这些方法使自动驾驶系统能够更…