正則化関数について
正則化について
この記事では最適化を行う際の正則化をまとめます。
Lasso(Least Absolute Shrinkage and Selection Operator)
言わずと知れた正則化。連続関数であり、パラメータにスパース性を持たせることができる。
で定義される。
*Lassoに用いられるノルムは ]上でノルムを下から抑える最大の凸関数である。
略証:2回ルジャンドル変換をした関数は元の関数を下から抑える最大の凸関数になる(らしい)、にとってはがそれにあたる。
*これより、正則化を近似する最高のモデルは。
グループ正則化
パラメータを同じ種類に分けて正則化をする手法。 の時、グループにを分けるとすると 添字集合を
$$g_k\subseteq\bigl\{1,2,3,\cdots,p \bigr\}\:\:\Bigl(k\in\bigl\{1,2,3,\cdots,M \bigr\}\Bigr)$$
と書いて、の部分集合を
で定義する。 この時、グループ正則化は
$$\|\beta\|_G\equiv\sum_{k=1}^{M} \|\beta_{g_k}\|_r$$
で定義される。 グループ正則化はグループ内に正則化をかけ、グループ間で正則化をかける。同じグループに属するはまとめて0になりやすい。
一般化連結正則化
各パラメータを頂点と見たグラフVを与え、隣接した変数間は同じ値になるようにする正則化。 グラフをとして、
で定義される。
時系列パラメータに対し、隣接する時刻では近い値になってほしい場合、
トレースノルム正則化(trace norm regularization)
今、を並べ変えた行列について、その番目の特異値をとする。 この時、トレースノルム正則化は
で定義される。