一、特征工程服务体系
1.1 特征分层架构
构建全行级特征工厂,实现"三横四纵"特征治理模型:
┌───────────────┐ │ 应用特征层 │ │ (实时特征服务) │ └───────┬───────┘ │ ┌───────────────────────────┐ │ 特征计算层 │ │ (批流一体引擎/特征衍生) │ └───────┬─────────────────┘ │ ┌───────────────────────────┐ │ 特征存储层 │ │ (HBase/Redis/FeatureStore)│ └───────┬─────────────────┘ │ ┌───────────────────────────┐ │ 特征元数据层 │ │ (血缘/版本/质量控制) │ └───────────────────────────┘
1.2 实时特征服务
特征计算流水线示例:
@feature_view( name='customer_credit_trend', entities=[customer_entity], ttl=timedelta(days=7), online=True ) class CustomerCreditTrend: # 定义特征计算逻辑 credit_utilization = Feature( derivation=WindowAggTransformation( group_by="cust_id", agg_expr=