之前节的线性回归为简化都是用的单特征,但现实中我们的预测因素很复杂不可能只有一个特征,下面总结多特征线性回归
多特征
之前总是用房价举例,预测房价和房屋面积的关系:
f(x) = wx + b , x表示其中的面积这个特征,这就是单特征
但是实际上,房价的影响因素是很多的,比如卧室个数、层数、房屋的年龄等等,真实的应用都是多特征的:
注意后续用下面的标识符表示第i条数据的第j个特征:
线性回归多特征表示
多特征表示如下:
其中xj为其中的单个特征,举个例子:
f(x) = 0.1* x1 + 50* x2 + … + 70 ,一种可以解释的就是基础房价为70,每增加1英尺,房价增加0.1,每多一个我是,房价多涨50…
更简单的多元线性回归表示方法
多特征线性回归更简单和通用的表示方法是:向量点乘法,至于是什么向量,可以暂时理解为一个list,list中的每个元素都是特征,如下表示就简化成:
z这个公式中 w 和 x都是向量 ,w 和 x是如下向量:
而公式中的点,表示点乘,点乘是逐项相乘然后相加,所以这个向量点乘的表示方法,与文章开始逐项相加的表示结果是一样的,它的优势会在向量化中详细介绍。