Logistic回归是一种统计方法,它可根据输入字段的值对记录进行分类。这种技术与线性回归类似,但用分类目标字段代替了数值字段。例如,假设某个电信提供商根据服务使用情况模式对其客户群进行了细分,将这些客户分为了四个组。如果人口统计数据可用于预测组成员资格,那么您可以为各个潜在客户定制报价。
研究模型 | 软件 | 日期 |
---|---|---|
多项逻辑回归 | SPSS Modeler | 2021年6月26日 |
一、案例背景
本示例主要讲述使用人口统计数据预测使用情况模式。目标字段custcat 有四个可能的值对应于四个客户组,如下所示:
由于目标具有多个类别,因此将使用多项模型。如果目标具有两个截然不同的类别(例如,是/否、真/假或者流失/未流失),那么可以改为创建二项模型。(二项Logis-tic回归)
二、研究方法及建模路径
首先建立流。数据源是statistics类型,选取sav文件(SPSS保存的文件,预览如下)添加类型节点并单击读取值,确保所有测量级别设置正确。例如,具有值0和1的多数字段可视为标志。
其次,将客户类别字段的角色设置为目标。将所有其他字段的角色设置为Input,结果如图所示(变量很多,注意其分类)
如上所述,因为本示例主要讲述人口统计,所以请使用过滤节点以选取相关字段(地区、年龄、 婚姻状况 、地 址、收人、教育程度、行业、退休、性别、居住地和客户类别),并不是所有字段都用到了,在进行决策树或其他机器统计学习模型时可以再添加,本次研究中其他字段可以排除在分析之外。
再次,进行逻辑回归建模。插入模型节点,在Logistic 节点上,单击模型选项卡并选择逐步法。选中多项、主效应和将常量纳入方程式。将目标的底数类别保留为1。模型将对其他客户与预订基本服务的客户进行比较。并且在“专家”选项卡上,选中专家模式,选中输出,然后在“高级输出”对话框中选中分类表。
然后进行模型浏览,查看成功的建模结果。执行节点以生成将添加到右上角的“模型”选用板中的模型。要查看其详细信息,在节点上用右键单击并选择浏览。结果如下所示,左侧是方程式(优势)右侧是变量的重要性程度。
具体来说,上面这个“模型”选项卡中显示了用于将记录分配到目标字段的每个类别的方程式。有四个可能的类别,其中一个是未对其显示方程详细信息的基准类别。在余下的三个方程式中显示了详细信息,其中类别3表示增值服务,依此类推。
在高级和摘要选项卡中,可以查看其他信息,如建模流程,具体参数置信区间等等,一些我自己的操作结果如下所示:
最后,可以查看下预测值表格。引出一个table即可。如果需要检验数据的分布,或者描述性统计,可以插入一个矩阵查看13个字段的具体信息。
三、结果解读
结果解读如下所示,前面的是两张图片!!我就不转文字啦~
整体多项的Logit在建模上没什么困难,主要是调参和解读部分,有没有实证意义,对于该方面的研究如果用Python可以更好的进行交叉验证网格搜索,但modeler更方便,各取所需。