vif-方差膨胀因子计算

server/2025/1/22 12:04:11/

vif-方差膨胀因子

  • 使用statsmodels中的variance_inflation_factor,数据集使用乳腺癌数据集

    import pandas as pd
    import numpy as np
    from sklearn.datasets import load_breast_cancer
    from tqdm import notebook
    from statsmodels.stats.outliers_influence import variance_inflation_factor
    from statsmodels.tools import add_constantcancer = load_breast_cancer()
    df = pd.DataFrame(cancer.data,columns=['_'.join(i.split()) for i in cancer.feature_names])
    df['y'] = cancer.targetdef calc_vif(df,desc_dict=None):"""df: DataFramedesc_dict: 字段中文释义字典return: vif DataFrame"""X=add_constant(df)vif_list = []for i in notebook.tqdm(range(X.shape[1])):vif = variance_inflation_factor(X.values,i)vif_list.append(vif)s = pd.DataFrame(vif_list,index=X.columns)s = s.reset_index()s.columns = ['feature','vif']if desc_dict:s['中文释义'] = s.feature.map(desc_dict)s = s[['feature','中文释义','vif']]return sstr_list = df.select_dtypes(include='object').columns.tolist() # string类型
    flo_list = df.select_dtypes(exclude='object').columns.tolist() # 连续型# vif 不能计算string类型
    df_vif = df[flo_list]# vif 计算不能有空值
    for i in notebook.tqdm(flo_list):df_vif[i] = df_vif[i].fillna(0)vif_data = calc_vif(df_vif)
    vif_data
    

    20230104I7cHIZ



http://www.ppmy.cn/server/160450.html

相关文章

利用 Java 爬虫获取 1688 商品评论的实践指南

在电商领域,商品评论是消费者决策的重要参考因素,同时也是商家了解产品反馈、优化服务的关键数据来源。1688 作为国内知名的 B2B 电商平台,拥有海量的商品评论数据。本文将详细介绍如何利用 Java 爬虫技术获取 1688 商品评论,并提…

Dify:低代码 AI 应用开发平台详解与实战指南

Dify:低代码 AI 应用开发平台详解与实战指南 近年来,大语言模型(LLM)的快速发展使得 AI 应用的开发变得更加高效,而 Dify 作为一款低代码 AI 应用开发平台,让开发者可以更轻松地构建和部署 AI 驱动的智能助…

虚幻商城 Fab 免费资产自动化入库

文章目录 一、背景二、实现效果展示三、实现自动化入库一、背景 上一次写了个这篇文章 虚幻商城 Quixel 免费资产一键入库,根据这个构想,便决定将范围扩大,使 Fab 商城的所有的免费资产自动化入库,是所有!所有! 上一篇文章是根据下图这部分资产一键入库: 而这篇文章则…

OS2.【Linux】基本命令入门(1)

目录 1.操作系统是什么? 2.好操作系统的衡量标准 3.操作系统的核心工作 4.在计算机上所有行为都会被转换为硬件行为 5.文件 6.简单介绍一些基本命令 1.clear 2.pwd 3.ls 1.ls -l 2.隐藏文件的创建 3.ls -al 4.ls -ld 5.ls -F(注意是大写) 4.cd 1.cd .. "…

搭建一个基于Spring Boot的书籍学习平台

搭建一个基于Spring Boot的书籍学习平台可以涵盖多个功能模块,例如用户管理、书籍管理、学习进度跟踪、笔记管理、评论和评分等。以下是一个简化的步骤指南,帮助你快速搭建一个基础的书籍学习平台。 — 1. 项目初始化 使用 Spring Initializr 生成一个…

记一次数据库连接 bug

整个的报错如下: com.mysql.jdbc.exceptions.jdbc4.MySQLNonTransientConnectionException: Could not create connection to database server. Attempted reconnect 3 times. Giving up. at sun.reflect.NativeConstructorAccessorImpl.newInstance0(Native Metho…

兼职全职招聘系统架构与功能分析

2015工作至今,10年资深全栈工程师,CTO,擅长带团队、攻克各种技术难题、研发各类软件产品,我的代码态度:代码虐我千百遍,我待代码如初恋,我的工作态度:极致,责任&#xff…