統計検定 準1級 過去問 解答/解答例と解説
2017年06月18日 (日) 試験
選択問題及び部分記述問題 問3
問題の要約
-
: 227次元の説明変数
-
: 2値の応答変数からなるジヒドロ葉酸還元酵素のデータ
-
: 回帰パラメータ
-
正則化ロジスティック 回帰分析と 正則化ロジスティック回帰分析を行う.
-
正則化項を加味し,対数尤度を最大化するように回帰パラメータを決定
-
最適化問題
: 正則化パラメータ -
上式の第1項は,対数尤度の −1 倍に次を代入して整理したもの
: 第 番目の応答変数 に対応する確率変数が値 1 をとる確率
-
正則化パラメータ の値を定めるために, の各値に対して次を行い,次の図を得た.
-
データの一部を用いて回帰パラメー タの推定
-
推定されたモデルで残りのデータに対する予測誤差を評価
※図は省略
図より,いずれの手法に対しても, 付近が最適であると判断.
このように を求める方法の名称を答えよ.
-
-
ふたつの手法について, の各値に対し, を推定.
特に,パラメータの中でゼロと推定されなかったものの個数をプロットし,次の図を得た.
※図は省略
この図が示す, 正則化と 正則化の性質の違いを簡潔に説明せよ.
解答
-
答 : クロスバリデーション(交差検証法)
-
答 : 正則化には回帰係数の多くをゼロと推定する傾向 (スパース性) があるが, 正則化にはスパース性はない.
※略解より抜粋