検定とは、
の2つの意味を持つ。本項目では2の意味を解説する。1については当該記事を参照せよ。
検定をするにあたっては、まず帰無仮説というものを立てる。これは想定している仮説が正しければこの仮説が確率的に成り立つ可能性は低いだろうと考える、最終的に棄却されてほしい仮説である。これに対して証明されてほしい想定している仮説のことを対立仮説と呼ぶ。
次に、その帰無仮説が発生するだろう確率を計算する。そして、帰無仮説が発生する可能性が事前に定めた一定確率を下回るならば、無事に帰無仮説は棄却される。要は多分こっちじゃないだろうといえるということである。一方、一定確率より大きいならば、この帰無仮説が成立する可能性が排除できないとなり、元の仮説が成立するか何とも言えないことになってしまう。
わかりやすい例がNHKにあったのでそれをもとに説明する。
細工されていないコインは表が出る確率も裏が出る確率も同様に確からしい(つまり1回投げたとき、表が出る確率も裏が出る確率も1/2である)。さて、この時、あるコインを10回投げて表が出た回数がわずか1回であった。この時、このコインは細工されているといえるだろうか?
さて、今回は有意水準5%にしたため帰無仮説を棄却できたが、仮にこれが1%だったとすると棄却ができない。何を意味するかというと、「このコインは細工されている」と断言することはできない、ということであり、「このコインは細工されていない」というわけではない点に注意せよ。
例えば10000人がガチャを200回回して、0.5%の排出率が定められたカードが9000枚しか出なかったと仮定する。果たしてこのガチャは正しい排出率が設定されていないといえるだろうか?
まじめに二項定理を使うと、計算がとてつもなく面倒であり、やっていられない。しかしながらサンプル数が膨大にあるため中心極限定理を用いることができる。
正しい排出率が設定されているという帰無仮説を定め、有意水準を1%とする。今回はどちらにずれていてもおかしい[1]ので検定は両側検定となる。
まず、標本の変数を定める。出たときを1、出なかったときを0とすると、期待値は0.005になる。次に、もともとの分散を求めると、0.004975となる。さて、200万というサンプル数は莫大なため、中心極限定理というものを用いることができ、これらの標本全体の平均の期待値は全体の期待値、分散はもともとの分散を標本数で割ったものの正規分布に近似可能である。
このことから、(出た回数/引いた回数-0.005)/sqrt(分散/引いた回数)は平均値0、分散1の正規分布に近似できることになり、具体的に代入するとこの値は今回の場合、約-10.025となる。有意水準を1%と定めており、両側検定を採用しているので、標準正規分布表に基づき、以下のものを探す[2]。
結論から言うと、2.58でこの条件を満たす。10.025は当然だがこの2.58よりも大きいので、帰無仮説である正しい排出率が設定されているというのはおかしいと判断でき棄却できる。よって対立仮説である正しい排出率が設定されていないというのが正しいといえる。
掲示板
掲示板に書き込みがありません。
急上昇ワード改
最終更新:2025/06/17(火) 01:00
最終更新:2025/06/17(火) 01:00
ウォッチリストに追加しました!
すでにウォッチリストに
入っています。
追加に失敗しました。
ほめた!
ほめるを取消しました。
ほめるに失敗しました。
ほめるの取消しに失敗しました。