《 データサイエンス基礎 》 ◆検定と有意水準
§ 検定統計量とp値
検定統計量は、得られたデータから計算される値で、帰無仮説が正しいことを前提にした場合に、そのデータが期待されているものからどの程度離れているか(どの程度予想外か)を示す。
そして、その検定統計量に基づいて計算されるp値(ピーバリュー)は、帰無仮説が正しいことを前提とした場合に、実際に得られたデータと同じ程度またはそれ以上に帰無仮説を否定するような極端な結果が得られる確率を表す。p値が小さいほど、帰無仮説が正しいことを前提とした場合にはめったに起こらないデータが得られたことを意味し、帰無仮説を棄却する根拠が強まる。
・例:p値が0.03であれば、帰無仮説が正しいことを前提とした場合には、3%の確率で帰無仮説を否定するようなデータが得られる、ということを意味する。