鲍鱼年龄预测
一、背景与目标
鲍鱼的生长在贝类家族中属于比较慢的种类.从受精卵开始,长到商品规格6-8厘米,通常需要1-4年甚至更长时间.以我国的皱纹鲍为例,大约需要近3年的生长才能达到7厘米左右.鲍鱼的生长速度随年龄的增长呈下降趋势.鲍鱼壳在生长过程中会留下类似树木年轮的生长纹.生长纹的明显与否,与其所处环境季节和摄食饵料的种类有关.在生长快速的季节,生长纹明显,距离较宽;在生长缓慢的季节则相反,生长纹密,距离较近. 有时候从鲍鱼壳的正面生长纹不容易直接判断它的准确年龄.可以将壳面附着的杂藻石灰虫等物清除干净,将鲍鱼壳用电灯光透视看出它们的年轮。本次数据分析的目的的对鲍鱼年龄的进行预测
二、数据说明
(一)数据来源
鲍鱼数据集可以从 UCI 数据仓库中获得,总共4177条数据,每条数据中包含8个特征值,
其 URL 是 http://archive.ics.uci.edu/ml/machine-earning-database/abalone/abalone.data。此数据集数据以逗号分隔,没有列头。每个列的名字存在另外一个文件中。建立预测模型所需的数据包括性别、长度、直径、高度、整体重量、去壳后重量、脏器重量、壳的重量、环数。最后一列“环数”是十分耗时采获得的,需要锯开壳,然后在显微镜下观察得到。这是一个有监督机器学习方法通常需要的准备工作。基于一个已知答案的数据集构建预测模型,然后用这个预测模型预测不知道答案的数据。
三、数据探索
(一)读取数据