程序的思路: 从配置文件中获取到待组合的特征,进行特征工程返回相应的特征和数据,这个过程中,保留中间特征工程结果,为了避免重复执行。 分批遍历所有的特征组合,进行训练和评估,然后保存评估结果。要是评估结果中已经有记录,就不做评估。然后读取所有评估结果得到最佳。
+---------------------+
| 1. 读取配置文件 |
+---------------------+
|
v
+---------------------+
| 2. 提取特征组合 |
+---------------------+
|
v
+-----------------------------+
| 3. 检查已保存的特征工程结果 |
+-----------------------------+
|
v
+------------------------------+
| 4. 执行特征工程并保存结果 |
+------------------------------+
|
v
+-------------------------------+
| 5. 遍历特征组合执行训练与评估 |
+-------------------------------+
|
v
+---------------------------+
| 6. 过滤已评估的特征组合 |
+---------------------------+
|
v
+---------------------------+
| 7. 保存评估结果与选择最佳 |
+---------------------------+