机器学习基本上就是特征工程——《特征工程训练营》

devtools/2024/10/20 4:16:13/

作为机器学习流程的一部分,特征工程是对数据进行转化以提高机器学习性能的艺术。

当前有关机器学习的讨论主要以模型为中心。更应该关注以数据为中心的机器学习方法。

本书旨在介绍流行的特征工程技术,讨论何时以及如何运用这些技术的框架。我发现,有些书籍只关注其中一方面,有时可能显得有些单薄。专注于概述的书籍往往忽略了实际应用的一面,而专注于框架的书籍可能让读者产生疑问:“为什么这样做有效呢?”


本书面向已经踏入机器学习领域并寻求提升能力与技能的机器学习工程师和数据科学家。假设读者已经掌握机器学习、交叉验证、参数调优以及使用 Python 和 scikit-learn 进行模型训练的基础知识。本书在此基础上进一步拓展,将特征工程流程直接融入现有的机器学习框架中,以提供更深入的学习体验。

特征工程的四个步骤包括特征理解、特征结构化、特征优化和特征评估。

特征理解--为了更好地解释数据。

特征结构化--为了在机器学习中有效组织数据。

特征优化--为了尽可能地从数据中提取信号和模式。

特征评估--根据机器学习调整特征工程。

数据科学家将超过一半的时间都花费在整理和操作数据上;值得花费充分的时间来整理数据集,以使所有下游任务更加轻松和有效。

优秀的特征工程能够产生更高效的数据集,使我们能够采用更快速、更小的模型,而不是依赖于通过混乱数据训练出来的缓慢而复杂的模型。

本书提供了许多案例研究,帮助读者真正学习和运用特征工程技术。

● 识别和实现特征转换

● 用非结构化数据构建ML(机器学习)流程

● 量化并尽量避免ML流程中的偏见

● 使用特征存储构建实时ML流程

● 通过操纵输入数据来增强现有ML流程

精彩试读


http://www.ppmy.cn/devtools/120852.html

相关文章

技术成神之路:设计模式(十九)桥接模式

介绍 桥接模式(Bridge Pattern)是一种结构型设计模式,通过将抽象部分与它的实现部分分离,使它们都能够独立地变化。它的核心思想是将接口与实现解耦,从而使得两者可以独立地变化。 1.定义 桥接模式将抽象部分与它的实现…

【系统架构设计师】经典论文:轮软件三层架构设计

更多内容请见: 备考系统架构设计师-核心总结目录 文章目录 摘要正文总结摘要 本人于 2022 年 1 月参与了中石化 XX 油田 XX 采油厂“用电管理系统”的项目建设,该系统建设目标是实现分单位、分线路、分系统评价、优化、考核,全面提升采油厂用 电管理水平。在该项目组中我担…

vue自定义div弹窗打开失败

在写自定义div弹窗的时候,实现类似el-dlaig打开关闭的效果。 1. showDialog的时候 div怎么也打不开,并且页面中也没有插入那块dom; 2. dialogVisible默认是true的时候是能正常展示div的 解决办法:类似el-dlalog的appen-to-body属性…

gRPC协议简介

gRPC 是谷歌开源的一套 RPC 协议框架。主要做两件事情:一是数据编码,二是请求映射。 数据编码 数据编码顾名思义就是在将请求的内存对像转化成可以传输的字节流发给服务端,并将收到的字节流再转化成内存对像。方法有很多,常见的…

C++基础补充(02)C++其他控制语句break continue goto等

文章目录 1. break2. continue 语句3. goto 语句goto的存在 4. 跳出多重循环4.1 goto 直接跳转4.2 C11及其后版本的 return 语句4.3 使用标志变量 在C中,控制语句用于管理程序的执行流程。常见有 break、continue 和 goto。 1. break break语句主要用于在循环或者s…

分层图 的尝试学习 1.0

分层图: 分层图的最短路: 又叫做 扩点最短路。不把实际位置看做是图上的点,而是把实际位置及其状态的组合,(一个点有若干的状态,所以一个点会扩充出来若干点)看做是图上的点,然后搜索…

第二十三节:学习拦截器或者使用AOP实现用户token参数请求检测(自学Spring boot 3.x的第六天)

这节记录下如何使用aop或者使用interceptor实现用户请求的是否带token,本文只是简单检查用户请求是否带参数token,并不对token的正确性进行验证。通常要从后台缓存中进行token校验。 第一种方式:拦截器方式 第一步:新建一个拦截器…

redis和mysql端口修改

因为之前有过被删库勒索的情况所以,今天记录一下怎么修改端口。 redis 要修改Redis的端口,您需要编辑Redis配置文件,通常名为redis.conf。 找到Redis配置文件: 在Linux系统上,该文件通常位于/etc/redis/redis.conf…