《 データサイエンス基礎 》 ◆サンプリング
§ 回答率
サンプリングが適切であっても、回答率が低い場合には、適切な調査が実施できないことがある。特に、回答する・しないが単なる偶然に左右されていなかった場合には、大きな問題になりうる。たとえば、1,000人のサンプルを抽出し、男女ともに500人ずつが含まれていたとする。回収率が60%だったとき、もし男も女も300人ずつが回答したのであれば、性別に偏りは生じない。しかし、偶然以外の何らかの理由により、男400人・女200人が回答したことで全体の回答率が60%となった場合には、性別に著しく偏りが生じる。
上記は極端な想定であり、現実にはここまで男女の回答率に極端な差が出ることはあまりないだろう。ただ、現実の調査でも、偶然以外の理由で男女の回答率に一定の差が出ることはある。たとえば、調査対象者を直接訪問する面接調査の場合、女性の一人暮らし世帯の回答率が低くなることがあるようだ。おそらく、防犯意識という偶然以外の理由によって回答率が低くなっていると推察される。