如何获得 w mathbf{w} w?
推导过程:
∥ X w − Y ∥ 2 2 = ( X w − Y ) T ( X w − Y ) = ( w T X T − Y T ) ( X w − Y ) = w T X T X w − w T X T Y − Y T X w + Y T Y begin{aligned} |mathbf{Xw}-mathbf{Y}|_2^{2} & =(mathbf{Xw}-mathbf{Y})^mathrm{T}(mathbf{Xw}-mathbf{Y}) \ & =(mathbf{w}^mathrm{T}mathbf{X}^mathrm{T}-mathbf{Y}^mathrm{T})(mathbf{Xw}-mathbf{Y}) \ & =mathbf{w}^mathrm{T}mathbf{X}^mathrm{T}mathbf{Xw}-mathbf{w}^mathrm{T}mathbf{X}^mathrm{T}mathbf{Y}- mathbf{Y}^mathrm{T}mathbf{Xw}+mathbf{Y}^mathrm{T}mathbf{Y} end{aligned} ∥Xw−Y∥22=(Xw−Y)T(Xw−Y)=(wTXT−YT)(Xw−Y)=wTXTXw−wTXTY−YTXw+YTY
将该式关于 w mathbf{w} w求导 (使用向量求导法则) 并令其为 0, 可得
X T X w − X T Y = 0 mathbf{X}^{mathrm{T}}mathbf{X} mathbf{w} - mathbf{X}^{mathrm{T}}mathbf{Y} = 0 XTXw−XTY=0
最后
w = ( X T X ) − 1 X T Y mathbf{w} = (mathbf{X}^{mathrm{T}}mathbf{X})^{-1}mathbf{X}^{mathrm{T}}mathbf{Y} w=(XTX)−1XTY
岭回归:
arg min w = ∥ X w − Y ∥ 2 2 − λ ∥ w ∥ 2 2 argmin_{mathbf{w}}=|mathbf{Xw}-mathbf{Y}|_2^2-λ|mathbf{w}|_2^2 wargmin=∥Xw−Y∥22−λ∥w∥22
可推导出
X T X w − X T Y + λ w = 0 mathbf{X}^{mathrm{T}}mathbf{X} mathbf{w} - mathbf{X}^{mathrm{T}}mathbf{Y} + lambda mathbf{w} = 0 XTXw−XTY+λw=0
最后
w = ( X T X + λ I ) − 1 X T Y mathbf{w} = (mathbf{X}^{mathrm{T}}mathbf{X} + lambda mathbf{I})^{-1}mathbf{X}^{mathrm{T}}mathbf{Y} w=(XTX+λI)−1XTY
自己写一个小例子 ( n = 3 , m = 1 ) (n=3, m = 1) (n=3,m=1) 来验证最小二乘法.
令函数 y = 2 x + 1 y=2x+1 y=2x+1, x x x取值5, 6, 7, y ^ hat y y^取值10, 13, 14.
y ^ = a x + b hat y=ax+b y^=ax+b, 用最小二乘法求 a , b a,b a,b :
a = ∑ i = 1 3 x i y ^ i − 3 x ‾ y ‾ ∑ i = 1 3 x i 2 − 3 x ‾ 2 = 2.028 a=frac{sum_{i=1}^3x_ihat y_i-3overline{x}overline{y}}{sum_{i=1}^3x_i^2-3overline x^2}=2.028 a=∑i=13xi2−3x2∑i=13xiy^i−3xy=2.028
b = y ‾ − a x ‾ = 0.132 b=overline{y}-aoverline{x}=0.132 b=y−ax=0.132
arg max w L ( x ) = ∏ i = 1 n P ( y i ∣ x i ; w ) argmax_mathbf{w} L(x)=prod_{i=1}^nP(y_i|mathbf{x}_i; mathbf{w}) wargmaxL(x)=i=1∏nP(yi∣xi;w)
本文发布于:2024-01-31 07:44:32,感谢您对本站的认可!
本文链接:https://www.4u4v.net/it/170665827726806.html
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
留言与评论(共有 0 条评论) |