一、基本概述
线性回归是回归分析的一种,用于确定两种或两种以上变量之间相互依赖的定量关系。其核心思想是通过找到一个线性方程,来预测一个或多个自变量(independent variables)与因变量(dependent variable)之间的关系。线性回归的目标是画出一条最佳拟合线(best-fitting line),从而了解变量之间的相互作用。在线性回归中,数据使用线性预测函数来建模,并且未知的模型参数也是通过数据来估计。
二、简单线性回归
- 定义:当线性回归分析中只包括一个自变量和一个因变量,且二者的关系可用一条直线近似表示时,称为简单线性回归(Simple Linear Regression)。
- 模型表示:简单线性回归的模型可以表示为:y=kx+b,其中 y 是因变量,x 是自变量,k 是回归系数(斜率),b 是截距。
- 应用:简单线性回归常用于两个变量之间关系的初步探索,如房屋面积与房价的关系。
三、多元线性回归
- 定义