图解机器学习/第四章 带有约束条件的最小二乘法
单纯的最小二乘法对于包含噪声的学习过程经常有过拟合的弱点
部分空间约束的最小二乘学习法
通过把参数空间限制在一定范围内,来防止过拟合现象。
$P$是满足$P^2=P$和$P^{\intercal}=P$的$b\times b$矩阵,表示的是矩阵$P$的值域$\mathcal{R}(P)$的正交投影矩阵。通过附加$P\theta=P$约束条件,参数$\theta$就不会偏移到值域$\mathcal{R}(P)$范围外了。
单纯的最小二乘法对于包含噪声的学习过程经常有过拟合的弱点
通过把参数空间限制在一定范围内,来防止过拟合现象。
$P$是满足$P^2=P$和$P^{\intercal}=P$的$b\times b$矩阵,表示的是矩阵$P$的值域$\mathcal{R}(P)$的正交投影矩阵。通过附加$P\theta=P$约束条件,参数$\theta$就不会偏移到值域$\mathcal{R}(P)$范围外了。
最小二乘学习法是对模型的输出$f_{\theta}(x_i)$和训练集输出$\lbrace y_i \rbrace_{i=1}^n$的平方误差
为最小时的参数$\theta$进行学习
平方误差$(f_{\theta}(x_i)-y_i)^2$是残差$f_{\theta}(x_i) - y_i$的$\mathcal{l}_2$范数,因此最小二乘学习法有时也称为$\mathcal{l}_2$损失最小化学习法。
如果使用线性模型
训练样本的平方差
其中,$y=(y_1,\dots,y_n)^{\intercal}$是训练输出的$n$维向量,$\Phi$是下式中定义的$n\times b$阶矩阵,也称为设计矩阵
训练样本的平方差$J_{LS}$的参数向量$\theta$的偏微分
将其微分设置为0,则
对顺序为$i$的训练样本的平方差通过权重$\omega_i \ge 0$进行加权,然后采用最小二乘学习,这称为加权最小二乘学习法