任务:依据电子商务平平台上真实的用户行为记录,利用机器学习相关技术,建立稳健的电商用户购买行为预测模型,预测用户下一个可能会购买的商品。
数据简介
数据整理自一家中等化妆品在线商店公布的网上公开数据集,为该化妆品商店真实的用户交易信息,数据集中每一行表示一个事件,所有的事件都与商品和用户相关,并且用户的点击行为之间是有时间顺序的。数据集中包含了商品和用户的多个属性,例如商品编号、商品类别、用户编号、事件时间等。
PS:如有需要Python学习资料的小伙伴可以加点击下方链接自行获取
数据说明
主要思路
对用户id进行分组
统计类别、品牌、收藏、加购物车、下单等特征,赋予合理的权重
构建时间特征
使用lgb的多分类模型进行训练
主要代码:
注意:此版本代码lgb版本是2.0.3
import gc
import pandas as pd
from sklearn.preprocessing import LabelEncoder
paths = r'E:\项目文件\CCF\电商用户购买行为预测'
data = pd.read_csv(f'{paths}/train.csv')
submit_example = pd.read_csv(f'{paths}/submit_example.csv')
test = pd.read_csv(f'{paths}/test.csv')
data['user_