为什么线性回归要假设误差满足均值为0,等方差的正态分布

精简回答:这样假设,能得到一个不错的拟合,尤其是当实际情况和假设接近时。

做线性回归
确定一个形如y = θ'X的函数
函数计算的值和观察值之间存在残差
同样的样本点多次抽样可能有很多观察值
将这些观察值和函数计算值的残差算出来,算很多个,得到分布,假设这个分布是均值为0,标准差为σ的正态分布(每个yi的残差的分布都是均值为0,标准差为σ的正态分布)
在此假设下,写出似然函数,极大似然估计参数,得到线性回归的系数。
这种假设最好和实际情况比较接近,这样的拟合效果才好,所以需要实际分布的先验知识,假设和实际情况接近,pi才准,pi准,似然函数就准,极大化似然函数,拟合效果才好。

留言

熱門文章