統計検定 準1級 例題集 解答/解答例と解説

選択問題及び部分記述問題 問8

問題の要約
  • 3種 (setosa,versicolor,virginica) のあやめの「がく片の長さ」について考察

  1. 等分散性について有意水準 5%の F 検定

    • setosa と versicolor の結果 (前者が分子,後者が分母,以下同様)

      F = 0.4663, num df = 49, denom df = 49, p-value = 0.008657 95 percent confidence interval: 0.2646385 0.8217841
    • versicolor と virginica の結果

      F = 0.6589, num df = 49, denom df = 49, p-value = 0.1478 95 percent confidence interval: 0.3739257 1.1611546
    • setosa と virginica の結果

      F = 0.3073, num df = 49, denom df = 49, p-value = 6.366e-05 95 percent confidence interval: 0.1743776 0.5414962

    出力結果に関する説明として,適切なものを選べ.

    ※選択肢は省略

  2. setosa と versicolor の「がく片の長さ」について平均値の差を検定

    有意水準 5%の Welch の t 検定結果

    t = -10.521, df = 86.538, p-value < 2.2e-16 mean of setosa mean of versicolor 5.006    5.936

    出力結果に関する説明として,適切でないものを選べ.

    ※選択肢は省略

  3. 3種のあやめの「がく片の長さ」の平均値の差を検定

    単純に 3回の t 検定を繰り返して判断してはいけない理由として適切なものを選べ.

    ※選択肢は省略

解答
  1. 答 : ①

    ① : 正しい.有意水準 5% なので,p 値が 0.05 以下であれば有意となる. versicolor と virginica の F 検定の p 値のみ,0.05 より大きいので有意でない.

    ② : 誤り.標本分散が 0 とならない限り,分散比の信頼区間に 0 を含むことはない.

    ③ : 誤り.信頼区間に 1 が含まれるということは,分散の差異が小さいということである.このとき,F 検定における仮説は棄却されない.1 が含まれるかどうかに関係なく,有意性は判断できる.

    ④ : 誤り.信頼区間と p 値には関係がある.

    ⑤ : 誤り.F 値は 1 から離れるほど分散の差異が大きくなる.

  2. 答 : ③

    Studentの t 検定の統計量は,次より求める.

    tS=x¯1x¯2s2N1+s2N2   t(N1+N22)
    s2=(N11)s12+(N21)s22N1+N22

    Welchの t 検定の統計量は,次より求める.

    tW=x¯1x¯2s12N1+s22N2   t(ν)
    ν=(s12N1+s22N2)2(s12/N1)2N11+(s22/N2)2N21
    ν : νに最も近い整数
    「個体数が異なる」ときでもWelchの t 検定を利用することはできる.よって,選択肢⑤は正しい.

    「このデータで分散の差異が全くない」ときを考える.すなわち,

    N1=N2=N (=50)
    s1=s2=s
    このとき,tS=tW となる. また,ν を求める式は,
    ν=(s2N+s2N)2(s2/N)2N1+(s2/N)2N1=2(N1)
    となり,Studentの t 検定の自由度と等しくなる.よって,選択肢①は正しい.

    「次に個体数が同じ」ときを考える.すなわち,

    N1=N2=N (=50)
    このとき,
    ν=(s12N+s22N)2(s12/N)2N1+(s22/N)2N1=(N1)(s12+s22)2(s12)2+(s22)2=(N1)(s12)2+(s22)2+2s12s22(s12)2+(s22)2
    ここで,s12=v, s22=v+d とおく.d は2つの分散の差である.
    ν=(N1)v2+(v+d)2+2v(v+d)v2+(v+d)2=(N1)v2+v2+d2+2vd+2v2+2vdv2+v2+d2+2vd=(N1)2(2v2+d2+2vd)d22v2+d2+2vd=(N1)(2d22v2+d2+2dv)=(N1)(212v2d2+1+2dvd2)
    d を大きくしていくと,自由度 ν は小さくなることがわかる.よって,選択肢②は正しい.

    ちなみに,d± とすると,νN1 となる. d=0 のとき,ν=2(N1) であったことから,

    N1ν2(N1)
    であることかわかる.

    「個体数が同じ」ときの tStW を考える.すなわち,

    tS=x¯1x¯2s2N+s2N=x¯1x¯22s2N
    tW=x¯1x¯2s12N+s22N=x¯1x¯2s12+s22N
    ここで,
    s2=(N1)s12+(N1)s22N+N2  2s2=(N1)s12+(N1)s22N1=s12+s22
    でることから,
    tS=tW
    であることがわかる.よって,選択肢④は正しい.

    最後に,選択肢③について考える.選択肢③の「この結果から」は,個体数が同じであることを示している. 前述のように,このときは tS=tW となる. 出力結果より,Welthの t 検定の t 値は -10.521,自由度は 86.538で,有意水準 5% では有意となっている. t 分布表からわかるように,上側 100α% 点は自由度が大きいほど,小さくなる. また,下側 100α% 点は(0に向かって)大きくなる. よって,Student の t 検定を利用すると,自由度は N1+N22=98 (>86.538) であるので, このときも有意となる.よって,③は誤り.

  3. 答 : ① (3回のいずれか一つが棄却される確率が高くなるから)

    ① : 正しい.

    ② : 結果は順番に影響されない.

    ③ : 互いの分散が同じでも問題がある.

    ④ : 検出力は良くなっても悪くはならない.

    ⑤ : 検定に関する意見ではない.