統計検定 準1級 過去問 解答/解答例と解説
2016年06月19日 (日) 試験

選択問題及び部分記述問題 問13

問題の要約
  • 次の図は,平成25年のM県における35市町村別大豆の作付面積 (ha) と収穫量 (t)

    ※図は省略

  • 作付面積を I,II,III,IV に層別

    作付面積 (ha) 層の大きさ 層内平均 (t) 層内標準偏差 (t)
    I 75未満 20 16 17
    II 75以上 ~ 250未満 8 165 69
    III 250以上 ~ 600未満 5 422 182
    IV 600以上 2 974 24
    母集団 35 163 258
    資料: 農林水産省「作物統計状況調査」平成25年
  1. 平成28年は,8市町村の大豆収穫量から全体の収穫量を推定する.

    各層から独立に標本を非復元無作為抽出.

    次の式で母集団総計 Y を推定する.

    Y^=h=14Nhnhi=1nhyhi

    h : 層 I,II,III,IV に対し,1,2,3,4 を対応

    Nh : 層 h の大きさ

    nh : 層 h における標本の大きさ

    yhi : 層 h における i 番目の標本の大豆収穫量

    次の 5通りの標本の大きさの配分を考える.

    配分方法 n1 n2 n3 n4
    A 2 2 2 2
    B 1 2 4 1
    C 1 4 1 2
    D 4 2 1 1
    E 4 1 1 2
    1. 配分方法A のとき,Y^35 の期待値を求めよ.

    2. 層内標準偏差は平成25年と同じであると仮定

      5通りの配分方法の中で,推定値 Y^ の分散が最小のものはどれか.

  2. 収穫量 (y) を作付面積 (x) により予測

    モデル1:

    y=β0+β1x+ϵ

    モデル2:

    y=β0+β1x+β2z+ϵ

    モデル3:

    y=β0+β1x+β2S2+β3S3+ϵ

    z : 層の番号 (z = 1, \ldots, 4)

    S2 : 層II のとき 1,そうでないとき 0

    S3 : 層III または層IV のとき 1,そうでないとき 0

    ϵN(0,σ2) : 誤差項

    ※出力結果は省略

    1. 適切でないものを選べ.

      ※選択肢は省略

    2. モデル3 において,作付面積が 500ha のとき,収穫量の予測値を求めよ.

解答
  1. (1) 答 : ②

    層 I,II,III,IV の層内平均を μ1, μ2, μ3, μ4 と書くとする. また,N=N1+N2+N3+N4 (=35) とおく.

    E[Y^N]=1NE[Y^]=1NE[h=14Nhnhi=1nhyhi]=1NE[N1n1i=1n1y1i+N2n2i=1n2y2i+N3n3i=1n3y3i+N4n4i=1n4y4i]=1N{N1n1i=1n1E[y1i]+N2n2i=1n2E[y2i]+N3n3i=1n3E[y3i]+N4n4i=1n4E[y4i]}=1N{N1n1i=1n1μ1+N2n2i=1n2μ2+N3n3i=1n3μ3+N4n4i=1n4μ4}=1N{N1n1n1μ1+N2n2n2μ2+N3n3n3μ3+N4n4n4μ4}=1N{N1μ1+N2μ2+N3μ3+N4μ4}
    これは,母集団の収穫量の平均を示している.よって,
    E[Y^35]=163

    (2) 答 : ②

    層 I,II,III,IV の層内標準偏差を σ1, σ2, σ3, σ4 と書くとする.

    V[Y^]=V[h=14Nhnhi=1nhyhi]=V[N1n1i=1n1y1i+N2n2i=1n2y2i+N3n3i=1n3y3i+N4n4i=1n4y4i]=N12n12i=1n1V[y1i]+N22n22i=1n2V[y2i]+N32n32i=1n3V[y3i]+N42n42i=1n4V[y4i]=N12n12i=1n1σ12+N22n22i=1n2σ22+N32n32i=1n3σ32+N42n42i=1n4σ42=N12n12n1σ12+N22n22n2σ22+N32n32n3σ32+N42n42n4σ42=N12n1σ12+N22n2σ22+N32n3σ32+N42n4σ42
    実際に値を代入すると,
    V[Y^]=202n1172+82n2692+52n31822+22n4242
    この分散を小さくするには,層内標準偏差の大きな層に対し,標本が大きくなるようにすればよい. よって,配分方法 A ~ E の中では,B の場合が分散が最も小さくなる.

  2. (1) 答 : ③

    ① : 正しい.モデル1 は,y=6.21504+1.05798x である.

    ② : 正しい.層の P値は 0.261 と高いので,この変数は除外候補として考えてもよい.

    ③ : 誤り.モデル2 もモデル 3も回帰係数の傾きはどの層でも同じである.

    ④ : 正しい.モデル3 において,2つのダミー変数を 0 とおけば,層 I に対する予測式となる.

    ⑤ : 正しい.自由度調整済み決定係数はモデル3 が最小である.しかし,他のモデルを大差ないので変数の少ないモデルを選択してもよい.

    (2) 答 : ⑤

    作付面積は 500ha であるので,S2=0, S3=1 である.よって,

    y=2.87655+1.02862×500+0+23.16200=534.59545535