回归分析中误差分析
3,152 阅读
先看一下常见的回归公式:
y = \sum_{j=1}^p \beta_j x + \beta_0
但实际上,上述等式在求得参数$\beta_j$和$\beta_0$之后并不能完全相等,预测值$\hat{y}$和真实值$y$之间是有一个残差的(residual)。 这里简单解释一下,正常情况下我们的观测值并不等于真实值,由于观测的 观测值和真实值之间的差值,而残差是观测值和拟合值之间的差值,其实没啥区别),即$\epsilon$,所以真正的等式是:
\hat{y} = \sum_{j=1}^p \beta_j x + \beta_0
y = \sum_{j=1}^p \beta_j x + \beta_0 + \epsilon
