文章目录
- 1 特征提取方法
- 1.1 特征提取过程
- 1.2 两类特征提取方法
- 2 基于数据驱动的方法
- 2.1 领域特定特征提取
- 2.2 基于频率的特征提取
- 2.2.1 模拟信号
- 2.2.2 傅里叶变换
- 2.2.3 抽取最大幅值对应特征
- 2.2.4 抽取峰值幅值对应特征
- 2.3 基于统计的特征提取
- 2.4 基于时间的特征提取
- 3 参考附录
1 特征提取方法
1.1 特征提取过程
“特征提取"的想法是对我们拥有的数据进行"加工”,确保我们提取所有有意义的特征,以便下一步(通常是机器学习应用)可以从中受益。
也就是说它是一种通过提供重要特征并过滤掉所有不太重要的特征来"帮助"机器学习步骤的方法。
这是完整的特征提取过程:
时间序列是一种特殊的存在。
这意味着你对表格数据或图像进行的许多转换/操作/处理技术对于时间序列来说可能根本不起作用。
对于表格数据和信号,他们的特征根本就不同,比如说峰和谷的概念,傅里叶变换或小波变换的想法,以及独立分量分析(ICA)的概念只有在处理信号时才真正有意义。
1.2 两类特征提取方法
目前有两大类进行特征提取的方法:
(1)基于数据驱动的方法: 这些方法旨在仅通过观察信号来提取特征。
它们忽略机器学习步骤及其目标(例如分类、预测或回归),只看信号,对其进行处理,并从中提取信息。
数据驱动方法的优点是它们通常在计算上简单易用,不需要相应的目标输出。
数据驱动方法的缺点是特征不是针对你的特定问题的。
例如,对信号进行傅里叶变换并将其用作特征可能不如在端到端模型中