ベイズ統計学

事後分布の期待値と分散

未知母数 π の事前分布が Be(a0,b0) のときの事前平均は,

E[π]=a0a0+b0
事後分布は Be(a0+y,b0+ny) となるので,事後平均は,
E[πy]=a0+ya0+b0+n
ここで,π^0=E[π]n^0=a0+b0 とおく. この n^0 はこの事前分布が無作為標本から得られたときの標本の大きさとも見なせるので, 仮説的な事前標本の大きさと呼ばれることがある. よって,事後平均 π^ は次のように書くことができる.
π^=n^0π^0+ny¯n^0+n
事後平均 π^ は,事前平均 π^0 と観測されたデータにおける平均 y¯ とを重み付けして平均をとったものに等しい. ここで,n とすると,
π^y¯    (n)

事前分布の分散は,ベータ分布であることから,

V(π)=a0b0(a0+b0)2(a0+b0+1)=π^0(1π^0)n^0+1
事後分布の分散は,
V(πy)=(n^0π^0+ny¯)(n^0+nn^0π^0ny¯)(n^0+n)2(n^0+n+1)
ここで,n とすると,
V(πy)0    (n)
となるので,どのような事前分布にもかかわらず,事後分布は標本平均 y¯ に収束する.

未知母数を区間推定する場合,次の方法がある.

  1. 確信区間

  2. 最高密度区間 (HDR; Highest Density Region)

最高密度区間は,未知母数 θ100(1α) 区間のうちで最も短く, 事後モードを含み,区間の両端における事後密度は等しい. この領域 R100(1α) 最高密度領域といい,次の条件を満たす.

  1. P(θRy)=1α

  2. θ1R, θ2R に対して P(θ1y)P(θ2y)