(三)组合特征与特征变换 学习简要笔记 #机器学习特征工程 #CDA学习打卡

ops/2024/10/18 20:19:47/

目录

一. 统计及组合特征

1)统计特征

2)业务特征

3)组合特征

(a)简单组合特征

(b)模型特征组合

二. 特征变换

1)对数变换(Logarithmic Transformation)

(a)简介

(b)代码

2)Box_Cox变换

(a)简介

(b)代码


一. 统计及组合特征

基本特征(时间特征与空间特征)具体内容可见第一期。

1)统计特征

2)业务特征

除了前面常见的统计特征包括平均值、方差、最大值、最小值、中位数、偏度、峰度等。还有一部分特征是业务统计特征,这部分需要结合到业务场景做具体统计,可以帮助我们更好地理解数据的分布和特点,为后续的模型训练和预测提供有用的信息。

3)组合特征

组合特征是指将原始特征进行组合,生成新的特征。通过组合不同的特征,可以发现特征之间的关联性,提高模型的表现。常见的组合特征包括特征相加、相乘、相除、取平均值等操作。通过合理地组合特征,可以提高模型的泛化能力和预测准确度。

(a)简单组合特征

再比如,我们把category A和B替换成user,item

(b)模型特征组合

GBDT+LR模型具体可参考这篇文章:GBDT+LR——特征工程模型化-CSDN博客

综合利用业务的统计特征和组合特征可以帮助我们更好地挖掘数据的潜在信息,提高模型的性能和效果。在特征工程的过程中,需要根据具体的问题和数据特点来选择合适的统计特征和组合特征,从而提高模型的预测能力。

二. 特征变换

1)对数变换(Logarithmic Transformation)

(a)简介

(b)代码

2)Box_Cox变换

(a)简介

(b)代码

Bye!


http://www.ppmy.cn/ops/15673.html

相关文章

vue3的getCurrentInstance获取当前组件实例

vue3的setup中没有this时需要使用getCurrentInstance()来获取。 在 Vue 3 中,getCurrentInstance 方法可以在组合式 API(Composition API)中获取当前组件实例。这个方法返回一个包含了组件实例的对象,你可以用它来访问组件的 pro…

vue3第二十四节(JSX用法)

vite 创建项目的情况下 安装 npm i vitejs/plugin-vue-jsx -D配置vite.config.js import { defineConfig } from vite import vue from vitejs/plugin-vue import vueJsx from vitejs/plugin-vue-jsx // https://vitejs.dev/config/ export default defineConfig({plugins: […

如何批量跟踪京东物流信息

随着电商行业的快速发展,快递业务日益繁忙,无论是商家还是消费者,都需要一种高效、便捷的快递查询工具。快递批量查询高手软件应运而生,以其强大的功能和便捷的操作体验,赢得了广大电商、微商精英们的青睐。 快递批量…

WebRTC初识

1. 概念 WebRTC (Web-Real-Time Communications) 是一项实时的通讯及技术,它允许网络应用或站点在不借助中间媒介的情况下,建立浏览器之间点对点(Peer-to-Peer)的连接,实现视频流、音频流或其他任意数据的传输。这种技…

CSS画一条虚线,并且灵活设置虚线的宽度和虚线之间的间隔和虚线的颜色

CSS画一条虚线,并且灵活设置虚线的宽度和虚线之间的间隔和虚线的颜色。 先看效果图: 在CSS中,你可以使用border属性或者background属性来画一条虚线。以下是两种常见的方法: 方法一:使用border属性 你可以设置一个元素的border…

SpringCloud系列(15)--Eureka自我保护

前言:在上一章节中我们说明了一些关于Eureka的服务发现功能,也用这个功能进行接口的实现,在本章节则介绍一些关于Eureka的自我保护 1、Eureka保护模式概述 保护模式主要用于一组客户端和Eureka Server之间存在网络分区场景下的保护。默认情况…

Pow(x,n)——力扣

python(快速幂) 50. Pow(x, n) 已解答 中等 相关标签 相关企业 实现 pow(x, n) ,即计算 x 的整数 n 次幂函数(即,xn )。 示例 1: 输入:x 2.00000, n 10 输出:10…

前端网络安全面试题:CSRF 与 XSS

CSRF 什么是 CSRF CSRF (Cross-Site Request Forgery): 跨站请求伪造是一种攻击手段,攻击者通过恶意构造一个链接或表单,诱使用户在已登录的目标网站上执行非本意的操作。当用户点击或提交这个恶意内容时,浏览器会自动带上用户的…