- 01 Logistic 回归
- 定义:用于研究影响关系,即X对Y的影响情况。Y为定类数据,X可以是定量数据或者定类数据
- 如何X 是150 170 那是定量
- 如果X 是 矮 不矮就是定类
- 探究X(定量)与Y(定量)之间的影响时 -->线性回归
- 如:衣服的价格对销量的影响
- 探究X(定量\定类)与Y(定类)之间的影响时 --> Logistic回归
- 如:衣服颜色对购买度的影响
- 翻译成人话:如用户的流失率以及什么因素造成了他的流失
- 分类:
- 二元Logistic回归:Y为两类
- 多元...:Y大于两类,类别间无层次对比
- 有序...:Y大于两类,类别间有层次对比
- 1.不愿意/无所谓/愿意 有层次
- 2.沪上阿姨/蜜雪冰城/嘿嘿茶 无层次
- 二元Logistic案例分析:
- 例题:收集到某公司各个商户ID,以及他们的注册时长、营业收入、成本,以及合作续约的情况。现在我们想基于这样的数据创建商户续约预测模型。
- 分析:探究各变量对是否续约的影响
- 打开华南商户续约.sav SPSS软件 链接:百度网盘 请输入提取码 提取码:ldsm
- 分析👉🏻回归👉🏻二元Logistic👉🏻 因变量 是否续约 ,自变量 时长,收入,成本👉🏻选项右边莱美肖拟合检验👉🏻在最后一个步骤👉🏻继续👉🏻确定
- 显著性对照0.05,小于则与原假设存在显著性差异,拒绝原假设,大于0.05没有显著性差异,接收原假设,
- 如果大于0.05就不能放入方程中
- B是回归系数
- 前两个是继续续约的利好因子,第三个是不利因子
- 定义:用于研究影响关系,即X对Y的影响情况。Y为定类数据,X可以是定量数据或者定类数据
- 二元Logistic小结
- 多元Logistic例题
- 数据文件涉及一份880人参与的关于早餐喜好的民意调查,该调查记录了参与者的年龄、婚姻状况以及生活方式是否积极,每个个案代表一个单独的响应者。请问什么因素影响着受访人每天吃什么早餐?
- 打开多元Logitstic回归👉🏻和之前一样 因变量 早餐 自变量 年龄 婚姻 生活态度 👉🏻统计 分类表 拟合优度 右边👉🏻保存 预算响应概率
- 判断模型能不能用、模型准不准
- 有序Logistic回归
- 打开有序.满意度.sav👉🏻和上面一样不过是有序👉🏻因变量 满意度 性别 治疗方法 因子 协变量 年龄 医疗费用👉🏻输出 平行性检验 预测类别 继续 确认
- 分析👉🏻描述统计👉🏻交叉表👉🏻满意程度 行 预测相应类别 列 👉🏻 单元格 百分比 行 👉🏻 继续
- 系数相反,常数项直接带入
- 有序Logistic小结
- 除了截距项之外,所有效应值要在参数估计值表格中的原始值基础上加上负号
- 给出模型时,可以不用考虑参数估计标准中的P值大小
- 对比小结
- SPSS绘图
- 简单箱线图
- 一维箱线图
- 成组箱线图
- 带误差线的折线图
- 误差条图
- 简单面积图
- 堆积面积图
- 人口金字塔
- 简单箱线图