机器学习(二)逻辑回归

news/2024/11/23 2:01:00/

Logistic Regression 虽然被称为回归,但其实际上是分类模型,并常用于二分类。

Logistic 回归的本质是:假设数据服从这个分布,然后使用极大似然估计做参数的估计。

逻辑回归API介绍


sklearn.linear_model.LogisticRegression(solver-'liblinear', penalty='12', C=1.0)solver可选参数:('liblinear', 'sag', 'saga','newton-cg', 'Ibfgs'),默认:'liblinear':用于优化问题的算法。对于小数据集来说,“liblinear”是个不错的选择,而“sag”和'saga'对于大型数据集会更快。对于多类问题,只有'newton-cg','sag','saga'和'lbfgs'可以处理多项损失;olinear”仅限于“one-versus-rest”分类。penalty:正则化的种类C:正则化力度默认将类别数量少的当做正例LogisticRegression方法相当于 SGDClassifier(loss="log",penalty="")、SGDClassifier实现了一个普通的随机梯度下降学习,而使用LogisticRegression(实现了SAG)。

逻辑回归API使用

使用【威斯康星州乳腺癌症数据集】,预测癌症分类,采用逻辑回归分析算法

数据集下载位置:UCI Machine Learning Repository

import joblib
import numpy as np
import pandas as pd
from sklearn.linear_model import LogisticRegression
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScalercols = ['Sample-code-number', 'Clump-Thickness', 'Uniformity-of-Cell-Size',  'Uniformity-of-Cell-Shape', 'Marginal-Adhesion', 'Single-Epithelial-Cell-Size',  'Bare-Nuclei', 'Bland-Chromatin', 'Normal-Nucleoli', 'Mitoses', 'Class']bcw = pd.read_csv('./data/breast-cancer-wisconsin-original/breast-cancer-wisconsin.data', names=cols)
bcw = bcw.replace(to_replace='?', value=np.NaN)
bcw = bcw.dropna()x = bcw.iloc[:, 1:10]
y = bcw['Class']# 数据分割x_train, x_test, y_train, y_test = train_test_split(x, y, test_size=0.2, random_state=10)# 标准化transfer = StandardScaler()
x_train = transfer.fit_transform(x_train)
x_test = transfer.fit_transform(x_test)# 逻辑回归estimator = LogisticRegression()
estimator.fit(x_train, y_train)print("score:\n", estimator.score(x_test, y_test))# 保存估计器
joblib.dump(value=estimator, filename='./data/breast-cancer-wisconsin-original/bcw.pkl')

运行结果:


http://www.ppmy.cn/news/595404.html

相关文章

LinkedList的底层实现原理(JDK8)

目录 一、知识点回顾二、LinkedList 的 add() 和 remove() 的实现2.1 list.add(e) 实现原理2.2 list.remove(e) 实现原理 一、知识点回顾 双向链表特点: 区间离散,占用内存宽松,空间复杂度小,时间复杂度 O(n)。优点:…

多元分类预测 | Matlab粒子群算法(PSO)优化极限学习机(ELM)的分类预测,多特征输入模型。PSO-ELM分类预测模型

文章目录 效果一览文章概述部分源码参考资料效果一览 文章概述 多元分类预测 | Matlab粒子群算法(PSO)优化极限学习机(ELM)的分类预测,多特征输入模型。PSO-ELM分类预测模型 多特征输入单输出的二分类及多分类模型。程序内注释详细,直接替换数据就可以用。程序语言为matlab,…

浏览器F12开发者工具

浏览器F12开发者工具 1.介绍2.工具附录 1.介绍 F12常用于网站界面测试、调试,分析问题,查看HTML元素、查看响应事件和数据等,还可帮助测试工程师定位前后端Bug; 其中使用最多的功能页面是:元素(Elements&…

电影《孤胆特工》看后小记

秀秀推荐的,说把自己感动得哭了。本想看一看星爷或发哥的作品。之前韩剧看过《雏菊》和《初恋这点小事儿》。 这个电影有点像《这个杀手不太冷》,小女孩都是光明与爱的象征,杀手/特工们都是一身绝技,以前杀人众多&#xff0…

进化:从孤胆极客到高效团队_极客学校:学习Windows 7 –无线网络

进化:从孤胆极客到高效团队 In the last two articles, we looked at how to prepare your PC for network access. In this installment, we are going to look at wireless network configuration. 在最后两篇文章中,我们介绍了如何准备您的PC以进行网络访问。 在…

oracle sql 转换成 hive sql -子查询转关联查询(十八),least和greatest函数,时间格式

其他sql格式也在更新中,可直接查看这个系列,要是没有你需要的格式,可在评论或私信我 个人目录 hive的nvl中的子查询 least和greatest函数理论案例,用时间格式格外笔记 least和greatest函数理论 函数例子作用结果leastselect lea…

Gameloft大作《孤胆车神:雄霸迈阿密》Gangstar: Miami Vindication

这个画面却很精致 享受iPhone/iPod touch上有史以来最令人沉醉的全3D犯罪模拟游戏!《孤胆车神:雄霸迈阿密》Gangstar: Miami Vindication给您呈现了一个错综复杂的复仇故事,带给您独一无二的全新感觉:投身于迈阿密黑帮生活中&…

进化:从孤胆极客到高效团队_极客学校:学习Windows 7 –管理磁盘

进化:从孤胆极客到高效团队 Hard Drives: every computer running Windows has them and none can function without them. They house all our data, so we should set them up correctly. Read on to learn more about how to use RAID to protect your data. 硬盘驱动器&…