つい先日、統計検定3級の過去問を解いてみました。
あるコミュニティーでこの試験の合格を目指して頑張っている人がいることを知り、完全に興味本位でざっとやってみたのです。
いつもながら特に準備することなく、いきなり実施です。
その結果、所要時間50分、3問間違いでした。
問題数30問なので得点率は90%ということになります。
所感ですが、数理的というよりは読解力が必要ですね。
ま、満点ではなかったのですが、勉強したとしても実際のテストで満点はとれないのでこんなもんでしょう。
これからもっと上位の級を受験する場合のファーストステップとしてはよい刺激になります。
・・・と、こんな感じかーと終わってもよかったのですが、せっかく実施したので、これを目標に勉強している方に突破のコツでも書いたら需要あるかと思い、記事にしてみることにしました。
試験範囲もテキストも見ずに、プリントアウトした過去問のみで気が付いたことを書いていくので、不足な点は各々確認してみてください。
ではいきます。
問1
数えられるものが「量的変数」です。
問2
確率問題ですねー。
計算自体は難しくないので、操作をしっかり理解して式にすること。
7/10 x 6/9 + 3/10 x 2/9
です。
赤が連続で同じになる確率(前半)と白が連続で同じになる確率(後半)の和になります。
問3
問2と問3は確率の典型的な問題で、計算時間もさほどかからないので確実にとりたい問題。
わたしは電卓を使っていいことを知らずに手計算して大幅に時間をロスりました。
6の掛け算が辛かった・・・。
もちろん、先に約分はしましたよ。
電卓忘れないように!
P=5C3(1/6)^3(5/6)^2
問4
読解力問題
って読解力の問題で片付けてよいのかなんですが、少しでも考えた場合のみコメント入れるようにします。(今後も)
Ⅰは、つまり・・・以下が×。そうとは限りませんからね。
Ⅱは、だまされる人がいるなと思います。支出割合のうち、一番高いのが23%の旅行関係費です。×
Ⅲは特に迷うことなくOK
一読で意味がわからなかったら、選択肢文はよく読み直しましょう!
問5
統計用語を知って入れば 取りこぼししないと思います。
わたしはしっかり理解していなかったので類推しました。
[1]
相対度数が全部バラバラの数値の選択肢なので、これさえわかれば正解は見つかります。
相対度数は12/47ですから、これで一つに決まります。
ちなみに「階級値」は後で調べました。
さいたま平均年齢59.9歳が、59-60に入るのでこの平均値59.5です。
[2]
真ん中と4当分した時の境目を探せばOK。
真ん中である24番目が含まれる範囲を探します。
第一四分位は12ですね。
[3]
読解力。ひとつひとつ丁寧に確認。
Ⅰはしっかり計算して確認すること。〇
Ⅱは読んだ瞬間に×です。それぞれの県の人数がわからないので算出できません。
Ⅲは×。千葉市の世帯主総数なんてわからないから。
問6
問題読んですぐにCの円グラフは除外。これは全体に対する割合を示すものだから。
aとbはある範囲を持った分布を示し、はずれ値があった場合、その存在はグラフ上に現れるのでOK
問7
[1]
Ⅰはずしちゃダメっしょ。都合悪いデータを外してはダメなのよ。
Ⅱその通り
Ⅲ中央値や四分位範囲は、数字の序列で決まるので、はずれ値によって影響は受けません。
はずれ値ひとつくらいでは全体としての降順、昇順序列は大きく変わりません。
[2]
これはちょっと考えてしまいました。
選択肢も厄介な書き方ですね。
はずれ値を除外する前後の話なので、分散は必ず変化します。
変化しないことはありません。
まず選択肢③がなくなります。
そして、はずれ値を除外したら、当然分散は下がります。
選択肢①②のどちらかです。
次に中央値がどうなるかですが・・・・。
前半部分まで読むと、はずれ値は平均値よりも高いことがわかります。
そうなると、中央値が変わらないか、もしくは減る方向になります。
ですから②が正解。
※問題も解いているときは、勘でいきました。
問8
[1]
まず定義を知っていれば正解を簡単に選べるでしょう。
わたしは知らなかったので問題文から推測しました。
「データの散らばりの程度を相対的に比較する」とあるので、絶対に割り算があります。
何を比較するかというと散らばりの程度です。
だから、⑤になります。
[2]
グラフ読み取り問題です。
これは[11]を間違えていると、こちらも間違えますね。
共倒れー。
このような問題の場合、一旦前の問題に戻って自信をもって正解か確認しておきましょう。
Ⅰ違うのはすぐにわかります。単純に数値比較です。
Ⅱ分子が小さくなって、分母が大きくなってますので、〇です。計算はしなくてよいです。
Ⅲ標準偏差にだいたい同じ値。体重と伸長は3倍くらい違う。だから体重の変動変数は大きくなります。
これも計算なしでいけます。だいたいのオーダー、桁数の違いから回答を求める力があると楽に回答にいきつきますね。
解答は④です。
問9
[1]
①人数を示す情報はないので×
②超えてます
③明らかにうそ
④明らかにうそ
⑤念のために確認。OK
[2]
Ⅰ その通り
Ⅱ そんなことわからないでしょ、グラフから
Ⅲ 50%のところに縦線を引けば、すぐに理解できる。×
①ですね。
問10
[1]
Ⅰ 正の相関はありそう。〇
Ⅱ 年々の経時変化の話ではありません。散布図です。ですから×
Ⅲ 打率が一番高いデータの左隣りに防御率の高いデータがあるので×
[2]
間違えてしまいました・・・
ⅠこれはOK
Ⅱ勝率が一番高いのは2017年。
打率見る。2013年以降しか確認せずに〇とした
==>正解は2004年に最高打率があるので×です。
Ⅲひとつひとつ確認してみる。〇
※グラフ問題は視野狭窄にならないように!全体をしっかり見ましょう!
問11
Ⅰ 計算するまでもなく、それぞれ半数を超えていることが確認できるので〇
Ⅱ 割合は増えていそうなので〇。「人数」に引っ掛からないように。
※電卓なくて計算するのが面倒だったが、念のため計算しておいた方が無難です。
Ⅲ そんなこと言えない
問12
この辺から文章を読むのに、少し疲れが出てきました。
Ⅰ 違うっしょ
Ⅱ 暗算してだいだい〇とした
Ⅲ 妥当な見解なので〇
問13
[1]
計算の仕方がわからなくてスキップ。(間違い扱い)
で、この作戦で正解です。
相関係数の計算問題は時間が結構かかるので、飛ばしましょう!
時間が十分に余ったらやるくらいでOKです。
わたしは時間は余ったのですが、計算式なんて覚えていなかったので、やりませんでした。
実践ではExcelに関数があるので、これで対応しましょう。
<一応解説>
もし解くならですが・・・。かなり面倒です。
パーツとしてSxy(x,yの共分散)、Sx、Sy(x,yの標準偏差)を求めます。
まずxとyの平均値を求める
xav=1,yav=3.5
共分散Sxyを求める時にx=1の計算項目は最初から除外する。差分が0になるから。
計算して-2/6=-0.33333です。
Sxはルートの中が4/6
Syはルートの中が・・・「面倒」
相関係数=-0.333333/root(2/3)/root(面倒)
です。
-0.333/0.8がすでに-0.79よりも絶対値で小さいので答えは見つかりますね。
もう一度いいます。
相関係数の計算問題は捨てましょう!
[2]
Ⅰ その通り〇
Ⅱ 違う×
Ⅲ うそ×
問14
得点がともに2倍になっても、数学と理科の得点の関係性は変わらないので、相関係数は変わらない。
問15
中央値、平均値、相関の問題ですね。
まず中央値が同じかを確認します。
下から数えて6人目の点数です。
すると共に82点になります。
次に相関を確認して、右上がりになっているので正の相関です。
①です。
※値がグラフ上で重なること=同じ値
という意味ではないことに注意。
引っ掛かりそうになりました。
値はグラフから読み取りましょう。
問16
[1]
降水量の最大と最小の値の関係性で正解を探します。
[2]
だいたいグラフの形が同じなので、違っている部分のみに注目してひとつひとつ確認します。
[3]
Ⅰ まさしくその通り
Ⅱ まさしくその通り
Ⅲ んなわけないでしょ。双方に因果関係はなし×
問17
間違えました・・・・
Ⅰ -40の項は相殺されるよねって思って〇にしてしまいました。
平均値であっても、そうでなくても-40の項は効きますので、0.6倍にはなりません。
Ⅱ これは〇(-40の項は計算の中で相殺される)
Ⅲ これは×
問18
[1]
Ⅰ んなわけない。×
Ⅱ その通り〇
Ⅲ ひとつひとつデータを確認する〇
[2]
Ⅰ その通り〇
Ⅱ そんなことはわからない×
Ⅲ 0.4を切ったデータもある×
問19
[1]
Ⅰ 必ず全員は必要なし×
Ⅱ 分けてはだめでしょ×
Ⅲ その通り〇
[2]
これ、間違えました。
Ⅰ ランダムに選ぶ必要があると思いましたが、そうではないので×です。(ここを間違えた)
Ⅱ全学年必要です
Ⅲ単純無作為抽出の場合は同数にならない
ここは定義をしっかり抑えておきましょう。しっかり得点できると思います。
まとめ
いかがですか。
ここに最小限の用語をしっかり抑え、注意深く設問文を読めば恐れることはありません。
ただし、文字を読む量が多いので、慣れていない人は問題文の読み慣れをしておいた方がよいですね。