WEKA数据集

news/2024/11/21 18:07:42/

WEKA数据集:

WEKA所处理的数据集是一个.arff(attribute relation file)为后缀名的二维表。这是一种ASCII文本文件。以%开始的行是注释。
表中具体的内容:
@relation+文件名称
@attribute+属性名和具体的属性值
@data后为每个实例对应的属性值

1、@relation<关系名>,此处关系名是一个字符串 ,如果字符串包含空格,必须加上引号(之英文标点的单引号或者双引号)

2、 属性声明:一系列@attribute开头的语句来表示。数据集中每一个属性都有对应的@attribute来定义它的属性名称和数据类型。
@attribute<属性名><数据类型>:
属性名必须是以字母开头的字符串,和关系名称一样,如果这个字符串包含空格,它必须加上引号。
属性声明语句是顺序很重要,最后一个声明的属性被称class值,在分类或者回归任务中,被默认为目标变量。

3、@data 数据信息:每个实例占一行,实例的各属性值用逗号隔开,某各属性值缺失,用问号表示,切问号不能省略。

4、WEKA支持的数据类型

  • numeric数值型、:整数或者实数
  • nominal-specification标称型、 如:Outlook{sunny,overcast,rainy} 打括号中的就是类别
  • string字符串型、 :可以包含任意文本。
  • data[data-formal]日期和时间型。 :默认日期格式:ISO-8601给出的格式:“yyyy-MM-dd HH:mm:ss”
  • 还可以使用integer和real类型,但是WEKA把他们都当做numeric类型看待。
    注: integer和real、numeric和string,data是区分大小写的,但是relation、attribute‘data不区分大小写。

稀疏数据

有时候数据集中含所有大量的0值,这时候用稀疏数据更加节省存储空间。在这里插入图片描述


http://www.ppmy.cn/news/283273.html

相关文章

Weka新手文章

Weka新手文章&#xff08;一&#xff09; 收藏 数据仓库&#xff0c;数据分析&#xff0c;不涉及商业方面的高层决策之用&#xff0c;故本篇文章只适合初学数据仓库&#xff0c;为了完成老师作业&#xff0c;且想用weka做简单数据挖掘之用的童鞋。 weka版本是3.6.2&#xff0c;…

卡尔曼滤波器——预测和观测的融合

卡尔曼滤波器&#xff1a;预测和观测的融合 整体理解 卡尔曼滤波器是一种高效的自回归滤波器。具有较强的鲁棒性。其鲁棒性来源于对不确定度的有效建模。对于卡尔曼滤波器&#xff0c;假定系统的真实状态为X&#xff0c;由于现实中存在种种不确定性&#xff0c;我们无法确定真…

英雄卡

题目描述 小李非常迷恋收集各种干脆面里面的英雄卡&#xff0c;为此他曾经连续一个月都只吃干脆面这一种零食&#xff0c;但是有些稀有英雄卡真的是太难收集到了。后来某商场搞了一次英雄卡兑换活动&#xff0c;只要你有三张编号连续的英雄卡&#xff0c;你就可以换任意编号的英…

Weka开发

Instances ARFF文件 3.5.5和3.4.X版本 从ARFF文件中读取是一个很直接的 import weka.core.Instances;import java.io.BufferedReader;import java.io.FileReader;...Instances data new Instances(new BufferedReader(new FileReader("/some/where/data.arff"))…

Stable Diffusion:使用Lora用二十张图片训了一个简易版薇尔莉特头像生成器(不作商用,纯纯个人兴趣,狗头保命)

目录 一、系统环境二、数据准备及预处理三、使用Stable Diffusion获取图像信息四、安装训练图形化界面五、参数设置及训练过程六、 效果测试七、常见报错处理 一、系统环境 同上一篇博客&#xff0c;云平台&#xff1a;CPU 1核&#xff0c;GPU 0.5卡&#xff0c;内存 20G&…

卡尔曼滤波分析

概述 在实际项目中&#xff0c;常常需要对数据进行滤波&#xff0c;这里分享卡尔曼滤波算法应用。 正文 卡尔曼滤波&#xff08;KF&#xff09;属于线性滤波器&#xff0c;使用均值和方差描述系统状态&#xff0c;将多个符合高斯分布的不确定信息源进行数据融合的一种最优状…

WeKa 数据集

今天找weka官方数据集差点被自己蠢哭&#xff0c;写个博客纪念一下。最近在学习weka的基本操作&#xff0c;来训练自己的数据进行分类等操作&#xff0c;网上找了一个视频Weka讲解视频 YouTobe视频 “https://www.youtube.com/watch?vLcHw2ph6bss&listPLm4W7_iX_v4NqPUjc…

[学习笔记] [机器学习] 7. 集成学习(Bagging、随机森林、Boosting、GBDT)

视频链接数据集下载地址&#xff1a;无需下载 1. 集成学习算法简介 学习目标&#xff1a; 了解什么是集成学习知道机器学习中的两个核心任务了解集成学习中的 Boosting 和 Bagging 1.1 什么是集成学习 集成学习通过建立几个模型来解决单一预测问题。它的工作原理是生成多个分…