《 データサイエンス基礎 》 ◆サンプリング
§ 適切なサンプリング
母集団からサンプルを選ぶことを抽出という。サンプリングで重要なのは、抽出を適切に行うことである。自分の家族だけ、友人だけ、といった抽出の仕方では、母集団について正確に理解できない。サンプル調査で母集団のことが調べられるかどうかは、適切なサンプリングを行っているかどうかが最も重要なポイントである。
適切なサンプリングのためには、抽出の際に以下の点に注意すべきである。
・無作為抽出:偏りをなくすためにランダムにサンプルを選ぶ
・サンプルサイズ* の確保:十分な数(サイズ)のサンプルを集めることで結果の信頼性を高める
* 「サンプルサイズ」という用語のほか、「サンプル数」という用語もある。両者は混同されやすいが別の意味であり、1回のサンプリングで抽出される人やモノの数を多くすることを「サンプル数を増やす」と表現するのは誤りである。