統計検定 準1級 過去問 解答/解答例と解説
2018年06月17日 (日) 試験
選択問題及び部分記述問題 問3
問題の要約
-
図1 のような正例 (+1) と負例 (-1) の 2群からなる 2次元データを考える (図は省略)
-
: 2次元縦ベクトル
-
次の 次の多項式カーネルを用いて SVM で判別
-
すべてのデータが正しく判別されるために必要な次数 と,その理由を答えよ
-
-
図2 のような正例 (+1) と負例 (-1) の 2群からなる 2次元データを考える (図は省略)
-
次の2つの手法で判別し,図 3(a) のような判別直線を得た (図は省略)
-
ソフトマージンSVM (線形カーネル,正則化あり)
-
線形判別分析
-
-
判別直線に近い観測値以外の観測値を取り除き,再び 2つの手法で判別を行った結果,図 3(b) のような判別直線を得た (図は省略)
-
線形判別分析は判別直線に変化が見られたが,SVMは判別直線に変化はなかった
-
SVMは判別直線に変化はなかった理由を述べよ
-
解答
-
答 : ※略解より抜粋
4次の多項式カーネルを用いることにより,データを完全に判別する関数
を構成することができる.よって,データは 4次のハードマージンSVMで判別が可能.一方,3次以下の多項式カーネルでは,符号の変化が高々 3回の 3次以下の多項式では判別ができない. -
答 : ※略解より抜粋
SVMはサポートベクトルのみ保持していればよく,それ以外の観測は除去しても結果は変わらないから.