第3講 統計的推定

赤池情報量規準 AIC

Xi (i=1,,n) を確率密度関数 f(Xiθ) を持つ確率変数とし, θ の最尤推定量 θ^nML が求められたとする. このとき,AIC は次のように定義される.

AIC=2i=1nlogf(Xiθ^nML)+2dim(θ)

確率変数 X={X1,,Xn} に対し観測値 x={x1,,xn} が得られたとする.このときの,尤度 L(θx) は,

L(θx)=i=1nf(Xiθ)
である.また,対数尤度は,
logL(θx)=logi=1nf(Xiθ)=i=1nlogf(Xiθ)
このとき,対数尤度を最大にする θθ^nML,最大対数尤度を logL と書くとする.
logL=logL(θ^nMLx)
ここで,新たに観測値を何セットが得られたとする.
X(1)={X1(1),,Xn(1)}X(S)={X1(S),,Xn(S)}
各セットに対し対数尤度を求め,それらを元に平均対数尤度 E[logL] を求めたとする.
E[logL]=1Ss=1SlogL(θ^nMLx(s))
この E[logL] は予測の良さを表しているといえる.

平均対数尤度 E[logL] は次のようにして推定することができると知られている.

E[logL]=logLdim(θ)
これに -2 をかければ,AIC となる.
AIC=2(logLdim(θ))
平均対数尤度 E[logL] は「予測の良さ」を表してしたので,AIC は「予測の悪さ」を表していることになる.