目录
一.数据科学
1.1 Numpy
1.2 scipy
1.3 pandas
1.4 Kaggle
二.总结
一.数据科学
1.1 Numpy
NumPy(Numerical Python)是Python中最受欢迎的数值计算库之一,它提供了高效的多维数组对象和对这些数组进行操作的函数。NumPy的主要优势在于其强大的数据运算能力和广泛的数学函数支持。
以下是NumPy的一些核心特点和功能:
-
多维数组对象:NumPy的核心是ndarray(N-dimensional array)对象,它是一个多维、固定大小的数组容器。ndarray可以包含不同类型的元素,并且在内存中以连续块存储数据,使得访问和处理数据更加高效。
-
数组操作和广播:NumPy提供了丰富的数组操作功能,如索引、切片、形状调整、数组拼接、分割等。此外,NumPy还实现了广播(broadcasting)机制,允许对具有不同形状的数组进行逐元素操作,而无需显式地编写循环。
-
向量化计算:NumPy通过使用高度优化的底层C代码实现了向量化操作,即在数组级别上进行运算,而不是逐个元素进行循环。这种向量化计算方式比纯Python循环更快速和高效。
-
内置的数学函数:NumPy提供了广泛的数学函数,包括三角函数、指数函数、对数函数、统计函数等。这些函数可以直接应用于NumPy数组,使得数值计算更加方便和高效。
-
科学计算工具:NumPy是许多科学计算和数据处理库(如SciPy、Pandas)的基础。它提供了对线性代数、傅里叶变换、随机数生成等常见操作的支持,并与其他库相互兼容,实现功能的扩展和集成。
使用文档
numpy使用文档
使用案例
import numpy as np# 创建数组
arr = np.array([1, 2, 3, 4, 5])
print(arr) # 输出: [1 2 3 4 5]# 操作数组
print(arr.shape) # 输出: (5,)
print(arr.size) # 输出: 5
print(arr.dtype) # 输出: int64# 索引和切片
print(arr[0]) # 输出: 1
print(arr[1:4]) # 输出: