統計検定 準1級 過去問 解答/解答例と解説
2018年06月17日 (日) 試験

選択問題及び部分記述問題 問3

問題の要約
  1. 図1 のような正例 (+1) と負例 (-1) の 2群からなる 2次元データを考える (図は省略)

    • x, x : 2次元縦ベクトル

    • 次の p 次の多項式カーネルを用いて SVM で判別

      k(x, x)=(1+xTx)p

    • すべてのデータが正しく判別されるために必要な次数 p と,その理由を答えよ

  2. 図2 のような正例 (+1) と負例 (-1) の 2群からなる 2次元データを考える (図は省略)

    • 次の2つの手法で判別し,図 3(a) のような判別直線を得た (図は省略)

      • ソフトマージンSVM (線形カーネル,正則化あり)

      • 線形判別分析

    • 判別直線に近い観測値以外の観測値を取り除き,再び 2つの手法で判別を行った結果,図 3(b) のような判別直線を得た (図は省略)

    • 線形判別分析は判別直線に変化が見られたが,SVMは判別直線に変化はなかった

    • SVMは判別直線に変化はなかった理由を述べよ

解答
  1. 答 : ※略解より抜粋

    4次の多項式カーネルを用いることにより,データを完全に判別する関数

    f(x)=sign{(x3)(x1)(x+1)(x+3)}
    を構成することができる.よって,データは 4次のハードマージンSVMで判別が可能.一方,3次以下の多項式カーネルでは,符号の変化が高々 3回の 3次以下の多項式では判別ができない.

  2. 答 : ※略解より抜粋

    SVMはサポートベクトルのみ保持していればよく,それ以外の観測は除去しても結果は変わらないから.