$$

$$

标准最小二乘法优化问题:

$f(w) = \sum_{i=1}^{m} (y_i - x_{i}^{T}w)^2$

也可以通过矩阵表示:

$f(w) = (y - Xw)^{T}(y - Xw)$

得到的回归系数为:

$\hat{w} = (X^{T}X)^{-1}X^{T}y$

这个问题解存在且唯一的条件就是XX列满秩: $rank(X) = dim(X)$ .

即使 X 列满秩,但是当数据特征中存在共线性,即相关性比较大的时候,会使得标准最小二乘求解不稳定, $X^TX$ 的行列式接近零,计算 $X^TX$的时候误差会很大。这个时候我们需要在cost function上添加一个惩罚项 $\lambda\sum_{i=1}^{n}w_{i}^2$ ,称为L2正则化。

这个时候的cost function的形式就为:

$f(w) = \sum_{i=1}^{m} (y_i - x_{i}^{T}w)^2 + \lambda\sum_{i=1}^{n}w_{i}^{2}$

Untitled

Untitled