《 データサイエンス基礎 》 ◆サンプリング
§ 多段抽出法
日本の全国民を対象に3,000サンプルを抽出し、調査対象に直接面会して調査する場合には、多段抽出法が用いられることがある。もし、日本全国から3,000サンプルを単純無作為で抽出したら、それぞれの調査対象者の住所は全国にばらけることになり、ある調査対象者の面接調査を終えた後に次の調査対象者の住所まで遠距離を移動しなければならない。
こうした調査にかかるコストを低減させるため、多段抽出法が用いられる。たとえば、仮に30人の調査員が分担してそれぞれ100人の調査対象者を面接調査する場合、まず30の市区町村を抽出し、それぞれの市区町村で100サンプルを抽出するという形にすれば、各調査員は同一の市区町村内に住む100人の調査対象者を訪問することになる。
一般に、多段抽出法で段の数を多くすると、調査コストは低くなる一方、サンプル誤差は大きくなる傾向にある。