LogisticRegressionCV 参数使用以及含义 笔记

news/2025/1/17 7:51:18/

第一次接触LogisticRegressionCV ,记录一下。

 Logistic回归是分类算法,不能应用于回归中(传入模型的y值,不能是float类型,必须是int类型)
 

正则化选择参数 :penalty   
                              ——>  L1 / L2    默认是L2的正则化,一般使用L2就可以了,但是如果还是过拟合,就可以用                                                                         L1,如果特征较多希望略去不重要特征,就有L1。

参数优化方式    :solver     
                             ——> 当penalty为l1的时候,参数只能是:liblinear(坐标轴下降法),lbfgs和cg都是关于目标函数的二                                                          阶泰勒展开,当penalty为l2的时候,参数可以是:lbfgs(拟牛顿法)、newton-cg(牛顿法变种),                                                          seg(minibatch) 、而liblinear通吃L1正则化和L2正则化     

                 维度<10000时,lbfgs法比较好,   维度>10000时, cg法比较好,显卡计算的时候,lbfgs和cg都比seg快

                    1.  liblinear:使用了坐标轴下降法来迭代优化损失函数。

          2.  lbfgs:拟牛顿法的一种,利用损失函数二阶导数矩阵即海森矩阵来迭代优化损失函数。

          3. newton-cg:也是牛顿法家族的一种,利用损失函数二阶导数矩阵即海森矩阵来迭代优化损失函数。

          4.  sag:即随机平均梯度下降,是梯度下降法的变种,和普通梯度下降法的区别是每次迭代仅仅用一部分的样本来计                          算梯度,适合于样本数据多的时候,SAG是一种线性收敛算法,这个速度远比SGD快。关于SAG的理解.

 

 分类方式参数    :multi_class  
                       ——>ovr(默认)、multinomial;这两种方式在二元分类问题中,效果是一样的,在多元分类问题中,                                                         效果不一样

                        1. ovr  :one-vs-rest, 对于多元分类的问题,先将其看做二元分类,分类完成后,再迭代对其中一类继续进行二元                                       分类

                         2.multinomial:  many-vs-many(MVM),即Softmax分类效果   

类型权重参数   :class_weight    
                       ——>权重一样可以不输入、可以选择balanced让类库自己计算类型权重、或自己输入                                                                              <class_weight={0:0.9, 1:0.1},这样类型0的权重为90%,而类型1的权重为10%>,

                        1.选择balanced,那么类库会根据训练样本量来计算权重。某种类型样本量越多,则权重越低,样本量越少,则                                权重越高。

                        2.

样本权重参数: sample_weight
                        由于样本不平衡,导致样本不是总体样本的无偏估计,调用fit函数时,通过sample_weight来自己调节每个样本权                          重

                       如果上面两种方法都用到了,那么样本的真正权重是class_weight*sample_weight.

交叉验证参数 :  cv
                      ——>  默认None,使用三折交叉验证。指定fold数量,默认为3,也可以是yield训练/测试数据的生成器。

 并行数   : n_jobs
                       ——> int:个数,-1:跟CPU核数一致, 1:默认值。

迭代终止判据的误差范围  :tol
---------------------
作者:一个有文化的暴发户
来源:CSDN
原文:https://blog.csdn.net/wangyuhao07/article/details/86152183
版权声明:本文为博主原创文章,转载请附上博文链接!


http://www.ppmy.cn/news/607515.html

相关文章

芯片产品介绍

芯片产品介绍 云端训练芯片 7纳米GPGPU高端自研云端训练芯片 基于全自研通用计算GPGPU芯片&#xff0c;天数智芯的硬件产品聚焦于云端训练及推理&#xff0c;通过丰富全面的自研指令集释放强大的可编程性与应用通用性&#xff0c;提供业界领先的AI算力密度与能效比。 天数智芯…

Python第三方库jieba(中文分词)入门与进阶(官方文档)

jieba “结巴”中文分词&#xff1a;做最好的 Python 中文分词组件 github:https://github.com/fxsjy/jieba 特点 支持三种分词模式&#xff1a; 精确模式&#xff0c;试图将句子最精确地切开&#xff0c;适合文本分析&#xff1b; 全模式&#xff0c;把句子中所有的可以成词的…

js ajax 递归,javascript ajax循环请求/ 长轮询终极解决办法——递归

ajax循环请求&#xff0c;不能使用for循环&#xff0c;原因如下&#xff1a;1. 因为ajax是异步执行&#xff0c;在还没有拿到服务器响应内容&#xff0c;就进入下一个for循环中解决办法&#xff1a;递归currentIndex 0;function ajax(){if(currentIndex>20){return;}var ur…

[JS] 什么是浮动,clear:both的使用

test.html里输入以下代码 <!DOCTYPE html> <html lang"en"><head><meta charset"UTF-8" /><meta http-equiv"X-UA-Compatible" content"IEedge" /><meta name"viewport" content"wi…

HBM显存与GPU

HBM显存与GPU 彻底改变显存技术 低功耗存储芯片&#xff0c;具有超宽通信数据通路和革命性的创新堆叠方案。 信息图&#xff1a;推出高带宽显存 HBM采用垂直堆叠方式和高速信息传输&#xff0c;以创新的小尺寸为用户带来了真正让人振奋的性能。这种内存在显卡中的应用只是个开始…

数据湖(十六):Structured Streaming实时写入Iceberg

文章目录 Structured Streaming实时写入Iceberg 一、创建Kafka topic 二、编写向Kafka生产数据代码

使用R绘制气泡图、带有显著性标记的热力图、渐变曲线图

大家好&#xff0c;我是带我去滑雪&#xff01; 一幅精美的科研绘图会有诸多益处&#xff0c;精美的图像可以更好地传达研究结果和数据分析的重要信息。通过使用清晰、直观和易于理解的图像&#xff0c;可以更好地向读者展示研究的发现&#xff0c;有助于读者理解和解释数据。还…

结巴使用自定义词典

源码下载的地址&#xff1a;https://github.com/fxsjy/jieba 演示地址&#xff1a;http://jiebademo.ap01.aws.af.cm/ 一 “结巴”中文分词&#xff1a;做最好的 Python 中文分词组件 。 支持三种分词模式&#xff1a;精确模式&#xff0c;试图将句子最精确地切开&#xff0…