sklearn.model_selection.train_test_split随机划分训练集和测试集

news/2025/2/6 4:08:26/

1 函数用途

train_test_split()是交叉验证中常用的函数,功能是将数组或矩阵按比例随机划分为训练集和测试集,使用方法为:

X_train,X_test, y_train, y_test =cross_validation.train_test_split(train_data,train_target,test_size=0.4, random_state=0, shuffle=True)

2 参数解释:

  • train_data:所要划分的样本特征集
  • train_target:所要划分的样本结果
  • test_size:如果为小数则代表样本占比(0到1),如果是整数则代表样本的数量,默认为0.25
  • random_state:是随机数的种子,默认为None。如果种子相同,则随机数相同,如果种子不同,则随机数不同。在需要重复试验的时候,保证得到一组一样的随机数。比如你每次都填1,其他参数一样的情况下你得到的随机数组是一样的。但填0或不填,则代表随机数的种子是一个随机值,每次结果都不同。
  • shuffle:划分前是否对数组或矩阵进行洗牌,默认为True。
import numpy as np
from sklearn.model_selection import train_test_split
X = np.arange(10).reshape((5, 2))
y = range(5)

其中X,y分别为:

X= [[0 1][2 3][4 5][6 7][8 9]]
y= [0, 1, 2, 3, 4]

对数据集进行划分,训练集占70%,测验集占30%,固定随机数的种子,划分前不重新洗牌:

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.33, random_state=1,shuffle=False)

划分完的数据集如下:

X_train= [[0 1][2 3][4 5]]
y_train= [0, 1, 2]
X_test= [[6 7][8 9]]
y_test= [3, 4]

转载于:https://www.cnblogs.com/iwangwei/p/10563999.html


http://www.ppmy.cn/news/611403.html

相关文章

Java 数值大小比较

1: 2个数的最大数 package me; public class Me {public static void main(String[] args) {int a 10;int b 6;int max a>b?a:b; //方法一System.out.println(max);int max1;if (a>b){ //方法二max1 a;System.out.println(max1);}else if (a<b){max1 b;System.…

Selenium Web元素交互

目录 目录 Web元素交互 附加验证 点击 发送键位 清除 使用选择列表元素 类型 单选 复选 构建类 选项列表 全部选项 选中的选项 选项 文本 值 序号 禁用的选项 取消选择选项 Web元素交互 用于操纵表单的高级指令集. 仅有五种基本命令可用于元素的操作: 点…

程序设计团队项目

目录 程序设计团队项目团队作业&#xff08;一&#xff09;&#xff1a;团队展示任务一&#xff1a;团队组建任务二&#xff1a;团队展示其他团队作业&#xff08;二&#xff09;&#xff1a;项目选题任务一&#xff1a;团队选题任务二&#xff1a;需求分析其他团队作业&#x…

《OpenCV3编程入门》学习笔记5 Core组件进阶(六)输入输出XML和YAML文件

第5章 Core组件进阶 5.6 输入输出XML和YAML文件 5.6.1 XML和YAML文件 XML和YAML是使用非常广泛的文件格式&#xff0c;可以利用XML或者YAML式的文件存储和还原各种数据结构&#xff0c;还可以存储和载入任意复杂数据结构 1.XML&#xff08;Extensible Markup Language&…

Java 二分法查找

二分法查找的步骤 1 查找前元素先排序 2 确定中间区域的位置mid(lowhigh)/2 3 比较 如果等于要查找的值则直接返回,如果大于查找的值,那么则去小的部分查找每次则会减1 如果要查找的值小于中间值 则去比较大的区域查找每次加1 package me; import java.util.Arrays; publ…

将5g做到世界顶级

将5g做到世界顶级 某公司最近向某电信合作伙伴保证&#xff0c;它有足够的库存&#xff0c;可以在2021年之前继续向它们提供5G基站芯片组。在上个月失去对这项技术的使用之前&#xff0c;这家公司囤积了为其网络设备供电的7nm处理器。由于该地区的无线运营商将花费1700亿美元推…

关于cookie与本地 存储的区别的问题。

1. cookie在浏览器和服务器间来回传递。而sessionStorage和localStorage不会自动把数据发给服务器&#xff0c;仅在本地保存。 2. cookie数据还有路径&#xff08;path&#xff09;的概念&#xff0c;可以限制cookie只属于某个路径下。存储大小限制也不同&#xff0c;cookie数据…

算法设计与分析第5章 回溯法(一)【回溯法】

第5章 回溯法 5.1 回溯法 1.回溯法的提出  有许多问题&#xff0c;当需要找出它的解集或者要求回答什么解是满足某些约束条件的最佳解时&#xff0c;往往要使用回溯法。 2. 问题的解空间 &#xff08;1&#xff09;问题的解向量&#xff1a;回溯法希望一个问题的解能够表示…