CATIはComputer-Assisted Telephone Interviewing systemの略で、電話調査を行う際にインタビュアが人為努力によって行うのではなく、コンピュータでの管理運用を行うことを目的として作成された複数(数台から数百台まで)規模のクライアント/サーバ型電話調査システムのことをいいます。
近年では電話調査システムのスタンダードとして世界各国で利用されています。その主な機能には、調査票設計、集計仕様設計、オートダイヤル及び再コンタクトスケジュール管理、インタビュー質的管理、インタビュア稼動管理などがあります。電話番号簿を必要としないRDD(Random Digit Dialing)による自動発信を利用する、質問内容の表示と回答の入力をPC上で行う、論理チェック機能などを工夫して入力した対象者の回答の論理的矛盾を防止できる、不在対象者に都合の良い時間帯にオートダイヤルによってコールが可能である、などの特徴があります。
CATI調査ではこのような機能をサーバ上で管理します
RDD(Random Digit Dialing)法は、コンピュータで電話番号をランダムに発生させて世帯番号にかかった場合のみ調査する電話調査の方法です。
現在、内閣支持率等の世論調査のほとんどがこの方法で実施されています。名簿方式が主流であった日本に、アメリカで開発されたRDD法が導入される契機となったのは、1998年参議院選挙で民主党の躍進を世論調査が予測できなかったことでした。従来の名簿方式では、都市部で急増する電話番号非掲載者をカバーできなかったためです。2000年総選挙で朝日新聞が導入後、比較的安いコストであることからも急速に普及しました。
この方法については、「母集団が確定できない」統計学的根拠の無い調査という根源的批判も根強く存在します。現在の最大の課題は、固定電話をベースに設計されているRDD法が、地域特定コードを持たない携帯電話等の普及で、急速に精度を下げている問題です。世論調査の現場では、「ポストRDD法」が緊急かつ重要な課題となっています。
日本における社会階層の継時的な調査研究を代表する「社会階層と社会移動(Social Stratification and Mobility)に関する調査」の略称。第一回のSSM調査は、第二次大戦後まもなく設立された国際社会学会(International Sociological Association)が呼びかけた国際比較調査に応じる形で、日本社会学会によって実施された1953年の六大都市調査、1955年の全国調査、およびいくつかの地域調査からなります。
その後、1965年に安田三郎を中心とする研究グループによって第二回の全国調査が実施され、それ以来、10年ごとに社会学者の研究グループの手で継承されて、2005年の第六回調査まで続いています。
SSM調査の研究関心は、日本社会の産業化・近代化とともに階層構造がどのように変化していったかですが、経済面での停滞が続く近年では、社会経済的格差の拡大や非正規雇用などの職業構造の変容にも焦点があてられています。
インターネット調査は、広義にはインターネットを介して回答が行われる調査モードを指します。
多くの場合、インターネット調査会社が募集したモニターを対象として行われるため、サンプリングフレームや母集団がはっきりと定義されない傾向があります。そのため、選挙人名簿や住民基本台帳に基づいた確率標本抽出調査のデータと比べるとさまざまな偏りがあることが知られています。
したがって、母集団推定を目的とする社会調査へのインターネット調査の応用には慎重になる必要があります。
しかし、一方ではインターネット調査はコストが低く、また無作為配置実験や動画などの提示にも優れているなど、メリットもあります。最近では、データの偏りを補正する統計的手法や、確率標本抽出された対象者のうちインターネット非利用者に対しては回線と端末を提供することで代表性を高める手法などが使われ始めています。
調査対象者に直接会って、調査対象者や対象者の所属する集団・社会についてたずねることによって情報を得る調査方法全般のことを指します。聞き取り(聴き取り)調査といういい方もされますが、多くの場合、質問紙を用いる面接調査は除かれます。あらかじめ考えた仮説の検証を目的として行う調査というよりは、調査を通して対象者の生活の中で生じるさまざまなできごとや経験の意味などを探索する調査といえます。
あらかじめ質問項目を決めている程度によって、質問紙による面接調査である構造化インタビューと半構造化インタビューと非構造化インタビューに、調査対象者の調査への主体的関わりの程度によって、アクティブインタビューとライフストーリーとライフヒストリーに分けられます。外からの観察では分からない、あるいは形式化された質問では捉えきれない、調査対象者個人の内面的世界、周りの人々との複雑な状況や関係性の発見に役に立てることができます。一方、実証的観点からは、対象者の記憶違いや、個人的特性の違いが質問への反応に影響するなどデータの客観性に欠けるという指摘もあります。
インフォーマントとは、調査対象者のことを指し、また資料提供者ともいいます。とくにフィールドワークにおいて、調査者はインフォーマントと単なる調査者-被調査者以上の関係(友人関係、師弟関係など)で接触することになりますが、相手と良好な関係(ラポール)を築けるかどうかが調査の継続や調査成果の公表の成否にかかわってきます。そのためにも、調査者はまず自身がフィールド(現場)で調査する意図や手順をインフォーマントに理解してもらい、調査における自身の立場を確立する必要があります。インフォーマントとの関与における具体的な方法は調査目的やインフォーマントの性格や属性、現場の雰囲気等により異なりますが、多面的な知見を得るためにもさまざまなインフォーマントとの人間関係をマネジメントしていくことが調査者には求められます。
一方で、長期にわたり調査者としてインフォーマントとかかわることで、調査者の視点がインフォーマントと同一化してしまうことがありますが(オーバー・ラポールの問題)、そのことは調査の客観性を失わせるだけでなく、インフォーマント側に「ひいきの引き倒し」をもたらしかねないことを注意しなければなりません。
インフォームド・コンセントとは調査倫理の一つです。社会調査を行う際には、必要事項をあらかじめ対象者に知らせ、対象者が理解し、承諾を得た上で行わなければなりません。
インフォームド・コンセントは、もともと医療における倫理として、患者に必要な情報を提供し、同意を得るというものでした。その後、実験や調査などの人々を対象とする研究にも広く浸透してきています。対象者に知らせる必要事項には、調査の目的と内容、調査の意義、調査による対象者の負担、収集したデータの保管方法、データや分析結果の公表方法などが含まれます。これらを十分に説明した上で、対象者から調査への協力に対して同意を得なければなりません。しかし、ひとたび対象者が同意しても、その後どの時点においても対象者はこれまでの同意を取り消し、拒否することができることは、忘れてはなりません。
これまでの社会調査の多くでは、調査対象者への説明と同意は、口頭で行われることが多くありました。しかし、医療におけるインフォームド・コンセントと同様に、社会調査においても協力依頼状という形で必要事項を書いた文書を用意し、調査対象者にその文書を見せながら口頭で説明した上で、同意書を取り交わすという形式も行われるようになってきています。
エリアサンプリングは、抽出台帳(名簿)を利用しないサンプリング方法のひとつです。
調査員は、選ばれた地点に出かけ、自分でその地点の世帯(住戸)リストを作成します 。そのリストから訪問対象となる世帯を決め、原則1世帯につき1人を調査対象者とし調査を行います。エリアサンプリングでは、あらかじめ世帯を構成している人数が何人かは分かりません。だからといって、対応してくれた人ばかりを調査対象者に限定すると、自宅にいることの多い主婦や高齢者にサンプルが偏ってしまいます。またそれとは別に、世帯人数が多いほど、1人の個人が対象者に選ばれる確率は低くなるという問題点もありまする。よって、エリアサンプリングによる社会調査では、このようなバイアスを回避するために、世帯人数によるウェイト補正を行うなどの工夫が必要となります。
日本では、公的機関による名簿の整備が進んでいるため、とくに学術的な社会調査において、このような抽出台帳を用いないサンプリングは、あまり必要とされてきませんでした。しかし、「住民基本台帳の一部を改正する法律」の成立(2006年)以来、調査のための抽出台帳の利用が制限されるようになりました。よって将来的に、抽出台帳を利用しないエリアサンプリングは、今まで以上に注目される可能性があります。
年齢、学歴、性別などの属性や、その他の要因による意見や行動の違いを調べるために、1時点で1回のみ調査を実施するデザインの調査のことを言います。通常の調査の多くは、横断的調査に分類されます。例えば、年齢によってあるトピックに関する意見がどう異なるかを調べようとする時、横断的調査では幅広い年齢層の人々を調査対象者とします。そして、年齢によって意見にどのような差異が認められるのかを分析します。このように、属性等の異なる人々の特徴を、時間軸に対して横断的に検討しようとしているため、横断的調査と呼ばれています。一方、時間軸に対して縦断的に検討しようとする調査を、縦断的調査(longitudinal survey)と呼びます。縦断的調査では、属性や要因による意見や行動の違いについて、同じ調査項目または調査票を使用し、複数の時点で調査を実施します。横断的調査は、縦断的調査のように長期に渡る調査の継続は必要としないため、その点で比較的手軽に実施できます。しかし、横断的調査は1時点のみを扱う性質上、因果関係の検討には適しておらず、縦断的調査の方が長けています。
回収率は、調査票の配布数と回収数によって算出される単純な概念のようにみえます。しかし、実は、(1) 標本抽出や調査方法から生じる制約をどのように考えるか(たとえば、標本抽出時の人為的ミスを当初計画していた標本数から取り除くのか否か等)、(2) 回収した調査票のうちデータとして有効なものをどのように定義するか(無回答の比率やいい加減な回答を鑑みて有効票をどう定義するか等)、(3) 回収できなかった調査票(欠票)をどのように定義するか(具体的には、「対象者が存在しない」「健康上の調査困難」「長期不在」「一時不在」「拒否」「その他」等)という3つの要素を考慮したうえで初めて算出されるものです。そのほかにも、予備サンプル(調査不能者に対して、新たな調査対象者とするための予備の調査対象者)を使った場合はどうするか等も微妙な問題です。社会調査協会の機関誌『社会と調査』第5号では、回収率について座談会も含め特集が組まれています。そこでは、回収率を「計画標本数(有効回収数+欠票)を分母におき、有効回収数を分子においた比率」と定義し議論を進められています。回収率に関するさまざまな議論や最近の動向については、この特集が「最新の研究成果」として注目されています。
量的な標本(サンプル)調査によって得られた結果から母集団の統計学的な分布や性質を推測するためには、標本統計量が母集団の分布特性を一定の確からしさで示していることを明らかにする統計的検定が必要です。統計的検定にあたっては、二つの仮説が設定されます。一つは、対立仮説(alternative hypothesis)と呼ばれるもので、標本の統計量が母集団の分布や性質を正しく反映していることを述べた仮説です。上記の例でいえば、「高齢者層のA政党支持率は、若年者層、中高年層よりも高い」という素直な仮説がそれです。一般に対立仮説は「H1」と表記されます。基本的にはこの仮説が標本の統計量によって支持され採用されればよいのですが、実は、「高い」という評価幅を持った仮説命題の証明は困難なのです。そのため、「高い」にしても「低い」にしても、ともかく「年齢層による差はない」とする仮説を立て、それを否定することで「差がある」ことを迂回的に証明しようという方針が採られることになります。その際に立てられるのが帰無仮説です。つまり、帰無仮説は、本来的に棄却されることを期待して立てられる仮説だということになります。上記の例では、「高齢者層のA政党支持率は、若年者層、中高年層と有意な差がない」というのが帰無仮説です。一般に帰無仮説は「H0」と表記されます。
統計的検定では、設定された帰無仮説に従って対象となる標本分布の統計量を導出し、それを母集団分布と比較することで仮説の採否を決定するのですが、その際には、検討すべき統計量のタイプ(比率、平均値、分散値、等々)や母集団分布の前提(二項分布、正規分布、カイ二乗分布、等々)あるいは帰無仮説の論理型に基づいて、それぞれ異なった標本分布の値が算出されることになります。その上で、上記の例では、3×3のクロス表の形を採るため、カイ二乗分布を基に標本分布の統計量が算出され、理論上の母集団分布の統計量と比較されます。標本分布の導出は、一般には数理統計学的な問題であって、誰もが導出できなければならないものではありません。実際の検定において適切な標本分布が何であるかは、すでに統計処理ソフトに組み込まれている場合がほとんどです。
さて、帰無仮説に基づいて算出された標本統計量が、母集団分布の統計量と比して非常に稀な値であると評価されたならば、その帰無仮説が誤りであったとして棄却することができます。「非常に稀な」という判定は、統計的に「100回中1回以下の出現率」とか「100回中5回以下の出現率」といった確率をもって下されることになります。前者は「p<0.01」と表記され、後者は「p<0.05」と表記されます。統計ソフトによっては、前者を「**」、後者を「*」と表記するものもあります。帰無仮説が非常に稀な出現率だということが示された場合、上の例では、「高齢者層のA政党支持率は、若年者層、中高年層と有意な差がない」という帰無仮説が棄却され、「高齢者層のA政党支持率は、若年者層、中高年層よりも高い」という対立仮説が採用されることになるのです。なお、帰無仮説が棄却されたことは、「年齢層で差がある」ということであって、実は「高齢者層で高い」という対立仮説そのものが証明されたことではないことに注意する必要があります。つまり、「高い」か「低い」かの判断は、実際の統計量を見て分析者が下す必要があるということです。
キャリー・オーバー効果とは、質問紙調査で、ある質問がその後の質問の回答に影響を与えることを指します。例えば、「あなたは日本の財政赤字が増大しているのを知っていますか」という質問の直後に、「あなたは、日本が外国に対して経済支援を行うことに対して賛成ですか、反対ですか」という質問を続けると、その前にある「財政赤字」という表現が経済支援に否定的な回答を誘導する可能性が考えられます。
キャリー・オーバー効果は、関連する質問が直後に続くか、近い場所にあるときに生じやすいので、関連する質問を調査票で離れた場所に配置することは、キャリー・オーバー効果を防ぐ有効な方法となります。
ただしキャリー・オーバー効果を厳密に考えることもよくありません。1つの調査課題のもとで作られる調査票は、ふつうは関連ある質問群がたくさん含まれ、いくつものキャリー・オーバー効果が考えられます。それらのすべてを離して配置していると、回答者にとっては、質問内容がばらばらで、あちこちに飛ぶ、答えにくい調査票になり、調査全体として大きなマイナスになるからです。
社会調査データの分析では、いくつかの変数を基準にして対象者を分類したいことがあります。
そのような場合には、注目しているいくつかの変数を用いて回答者同士の類似度を定義し、「似たもの同士」のまとまりに分類するクラスター分析が有効です。
クラスター分析には大きく分けて、階層的クラスター分析と非階層的クラスター分析の二種類があります。階層的クラスター分析は、「似たもの同士」をまとめ上げていく過程をデンドログラム(樹形図)で描くことができるのが特徴です。
一方、非階層的クラスター分析では、分析者があらかじめクラスター数を指定し、回答者を指定されたクラスター数にまとめます。クラスター分析は、母集団における統計量を推定したり変数同士の因果関係を推論したりするためのものではありませんが、回帰分析など他の分析手法と組み合わせることによって、幅広い用途に用いることができます。
名簿から標本を抽出する際、すべての個人を同じ確率で選ぶための方法は、その地点で計画された標本の数だけ単純無作為抽出を繰り返すという作業だけではありません。もっと効率的なやりかたがあります。
仮に、地点の名簿から計画された数だけ標本を選ぶ際、各個人が選ばれる確率が1/250になったとしましょう。この時、名簿のはじめの1人目から250人目までの中から、ランダムに1人の標本を選び、それを開始番号とします。あとはその開始番号から250人おきの等間隔で抽出を繰り返します。この手順によりどの個人も、名簿から同じ1/250の確率で選ばれることになります。これは系統抽出法(あるいは等間隔抽出法)と呼ばれるもので、各個人が選ばれる確率(1/a)を把握し、名簿の1人目からa人目までで無作為に抽出したスタートとなる標本と、a人おきという抽出間隔(インターバル)を使用し、名簿から標本を抽出する方法です。
系統抽出法は、スタートとなる標本を選ぶ時のみ単純無作為抽出を行い、後は機械的に等間隔で抽出していけばよいので、計画標本数だけ単純無作為抽出を繰り返す作業と比べ作業が効率的です。役所や役場では、抽出台帳(名簿)の閲覧時間が制限されていることが多いため、系統抽出法により抽出・転記の作業の時間短縮を図ることが有効となります。
公的統計は国や地方自治体などの公的機関が実施する統計の総称で、調査の対象も個人、世帯、法人、各種団体などとさまざまです。以前は官庁統計といわれていましたが、現在は公的統計という呼称が用いられています。公的統計(官庁統計)は予算策定など行政上の利用のほか、政策立案や研究のためにも利用されています。旧統計法のもとでは、官庁統計は、指定統計、承認統計、届出統計などに分けられていました。平成19年5月23日法律第53号として統計法が全面的に改正されました。この新統計法では、「公的統計」という言葉が使われ、「公的統計」とは、行政機関、地方公共団体または独立行政法人等が作成する統計をいうと定められています。この法律に基づく統計は、指定統計等の分類に代わって、基幹統計、一般統計という呼称が用いられています。国勢統計は基幹統計の一つです。公的統計は重要な指標を多く含む信頼性の高いデータのため、学術研究や高等教育において個票データとして利用したいという声が多く、近年ではこのニーズに対して(1)回答者がだれか特定されないような処理を行った個票データの提供(「匿名データの作成・提供」)と(2)指定された統計表を提供する「オーダーメード集計」の提供が行われています。
コンフィデンシャリティとは調査倫理の一つであり、対象者のプライバシーと個人情報を保護することです。社会調査においては、調査によって集めた個人情報を、正当な理由以外で他人に漏らしてはなりません。この倫理を守るために、回答を得た調査票やフィールドノートなどの紙媒体の情報に関しては、施錠可能な場所で厳重に管理すること、不必要なコピーは作成しないなどの注意が必要となります。また、電子媒体上の情報に関しては、パスワードによって保護したり、添付ファイルとしてメールで配布しないなどの方策をとる必要があります。
さらに、社会調査データや分析結果の公表の際には、個人が特定される可能性がある情報は削除したり、居住地を関西地方というように幅のあるカテゴリに加工するなど、匿名性の保護には万全を期す必要があります。ただし、インタビュー調査などによる研究において、どうしても個人が特定されてしまう情報や、実名を記したりすることが避けられない場合もあります。その際には、対象者から公表の仕方について完全な承諾を得ておく必要があります。
サンプリングとは、母集団の一部(標本)を調査対象として抽出することです。母集団が大規模になるほど、母集団すべてを対象とした全数調査は費用的にも時間的にも困難になります。
そのため、サンプリングによって得られたデータをもとに母集団の状況を推論する標本調査が行われることが多くなります。サンプリングは有意抽出と無作為抽出(ランダムサンプリング)に分けることができます。無作為抽出では母集団に属するすべての個体を同じ確率で抽出するため、分析から明らかになった標本の特徴が母集団についてもあてはまるかどうかを確率的にいうことができます。
一方で有意抽出は、たとえどれほど多くの回答を集めたとしても、その分析結果を一般化することはできません。
関連項目:多段抽出法、層別(層化)抽出法、系統抽出法、エリアサンプリング
参与観察とは、調査者が研究対象とする集団のメンバーとなって日常生活をともにしながら、比較的長期間にわたって対象集団を観察する方法です。この方法の長所は、調査者が対象集団に参与(参加)することで、対象者と同じ経験をすることができ、できごとの理解の大きな助けになることと、長期にわたる参与によって、調査対象者が調査者に特別な意識をせずに当たり前に接してくれるようになることです。
参与観察によって、外から見ているだけでは分からなかった集団について、中から細かく調べて明らかにすることができます。その一方で、参与観察によって得られるデータは、調査者の集団内で得た立場、地位や対象者との関係、参与の程度によって決まるため、他の調査者による完全な再現は実質的に不可能となります。そのため、データの信頼性や、集団内での立場、地位によって生じる観察の偏りは避けられません。他の観察方法やさまざまな資料の収集、インタビューを併用するなどして、偏りを避けるように努める必要があります。
市場調査は、マーケティング・リサーチとも呼ばれ、世論調査、学術調査、官庁や地方公共団体が実施する調査と並んで、毎年非常に多く実施されている調査です。市場調査は、企業が、市場、製品、販売、流通、広告、消費者などに関する情報を収集・分析して、有用な知見を得たり、何らかの意志決定を支援する調査のことをいいます。消費者のニーズ調査やテレビ番組の視聴率調査が代表的な例です。
市場調査には、あらゆる調査方法が用いられています。質問紙法やインタビュー法はもちろんのこと、実験社会心理学的方法を用いた消費行動実験、市場実験などの手法も用いられます。学術調査や世論調査と異なり、目的や内容に応じて、コストがかからない方法が利用される傾向があります。質問紙調査ではインターネット調査やオムニバス調査(異なる複数の調査主体の質問文を1つの調査票にまとめ、実施する調査)、インタビュー法ではグループインタビューなどがよく用いられ、近年ではインターネット上のデータをマーケティングに利用するために分析手法として、テキストマイニングの手法がよく使われています。
信頼性係数とは、測定の信頼性のレベルを示す係数で、測定値の分散に対する真値の分散の割合として定義されます。信頼性係数の推定方法には、再テスト法や折半法があります。再テスト法では、あるサンプルを対象に同一の測定を2回実施し、それらの相関係数を算出することで信頼性係数を推定します。折半法では、測定項目を奇数番目と偶数番目というように2つの下位測定に分割し、下位測定間の相関係数を算出することで信頼性係数を推定します。分割の可能なすべての組み合わせから信頼性係数を計算するのが、よく知られたクロンバックのα係数です。α係数は実際の測定と、同じ概念を測定する同じ長さの仮説的な測定との相関の期待値であり、信頼性係数の推定値の下限値を与えます。測定の信頼性が低い場合には妥当性も低くなりますが、信頼性が高いからといって妥当性も高いとは限りません。したがって、α係数のみに注目して尺度構成すると、妥当性の低い測定となってしまう可能性があります。
全数調査とは、母集団の中のすべてのメンバーに対して実施する調査です。悉皆(しっかい)調査とも呼ばれ、国勢調査や学校基本調査などが代表的なものです。
標本調査と比べると優れた方法のように見えますが、次のような問題があります。ひとつめは、標本調査と比べると、金銭的・人的コスト、時間的コストがかかるという問題です。社会調査はその社会その時代を迅速に示すことが要請されることが多く、とくに時間的コストがかかりすぎることは調査の意義にかかわる問題といえます。ふたつめは、全数調査では、データが膨大になるために、誤答・誤記入、コーディング・ミス、入力ミスなどの非標本誤差が大きくなりやすいという問題があります。たとえ標本誤差がゼロの全数調査であっても大きな非標本誤差のために、通常の標本誤差をもつ標本調査よりも誤差の総計は大きくなる可能性があります。
これらの理由から、規模の大きな母集団を対象とする場合に全数調査を実施することはまれであり、多くの場合、標本調査を行うことになります。
多段抽出法により、抽出する個人の集合(地点など)の数を限定すればするほど、そこから抽出された標本の特徴が母集団の特徴から乖離する恐れが大きくなります。例えば、日本全体の国民を母集団とした場合、たまたま抽出された地点が、農村や商店街ばかりであれば、標本は農家の人または自営業の人ばかりになり、母集団である日本国民全体の職業分布と標本のそれが明らかに乖離してしまいます。多くの社会調査においては、職業の違いは、人びとの生活様式や意識の違いに影響すると考えられることから、可能な限り母集団の職業の分布と、標本の分布を近似させなければなりません。そこで用いるのが、層別抽出法です。
この方法では、地点を調査目的にとって重要と見なされるある特徴(例えば産業構成比・職業構成比・人口規模など)についての違いから、いくつかの層(グループ)に分け、そのような層から必ず一定数の地点が抽出されるように調整します。層別抽出法で、それぞれの層に割り当てる地点の数を、層における人口規模に比例させて決定する方法を、比例割当といいます。
多段抽出法は、調査対象が都道府県や日本全体といった大規模な場合、いきなり個人を抽出するのではなく、例えば、最初に市区町村を抽出し、つぎにその中から投票区を抽出してから、そこの選挙人名簿や住民基本台帳などの名簿を用いて個人を選び出すサンプリング方法です。
単純無作為抽出と比べて多段抽出法のメリットは、標本となる個人を抽出する際の手間や労力を削減できること、そして、最終的に抽出された標本が地理的に隣接するため、面接法や留置法における調査員の時間・労力・経費を節約できることです。ただし、最終段階で抽出される標本サイズ(個体の数)のばらつきを抑えるためには、はじめに市区町村を抽出する段階で工夫が必要となります。例えば、所属する人口に比例した確率で市区町村を抽出する方法(確率比例抽出法)が用いられます。
ダブル・バーレル質問とは、1つの質問文の中に2つ以上の論点が含まれている質問のことです。例えば、「悪いことをすれば、神仏はバチをあてるという考えについて、あなたはそう思いますか、それともそうは思いませんか」、という問いがあったとしましょう。神様はバチをあてることがあるが、仏様はバチをあてることは絶対にないと考えている回答者にとっては、この質問にどのように答えるべきか、戸惑うでしょう。そのような場合は、「神様はバチをあてる」と「仏様はバチをあてる」という2つの文章に分割し、それぞれについて質問することが望ましいといえます。
また、「マナーに反するので、電車の中では携帯電話の使用は控えるべきだ」という質問は、別のダブル・バーレルの例です。マナーに反するという理由以外で電車の中では携帯電話を使うべきではないと考えている回答者にとって、このような質問は賛成と答えるべきか反対と答えるべきか混乱するので、よい質問文とはいえません。
しかし、ダブル・バーレル質問がいつも不適切とは限りません。神様と仏様によってバチのあて方が異なると思う人がいない場合やマナーに反するという理由以外が見いだせない場合には、このようなダブル・バーレル質問が不適切とはいえないことにも留意しましょう。
データ・アーカイブとは調査データを収集し、分析可能な形式に編集して公開する専門機関のことです。かつては、調査した人や調査主体だけしかデータを分析できませんでしたが、データ・アーカイブによって、調査者や調査主体以外の研究者も過去の貴重な調査データを二次分析することが可能となりました。国際比較調査であるISSP調査やEuropean Values SurveyはドイツのGESISからダウンロードできるほか、World Values Survey、GSS調査データなどもインターネット経由で入手できます。
日本においては、東京大学社会科学研究所のSSJデータ・アーカイブが、900近くのデータを公開しており、大学等の研究者や大学院生は無償で個票データを二次分析のために利用することができます。
また、大阪大学人間科学研究科のSRDQは、利用者に制限がなく、データをダウンロードせずにインターネット上で直接統計分析ができる機能があり、出版されたテキストとそのサポートサイトによって統計分析の学習ができるという特徴があります。
量的調査によって得られた標本の統計量から、実際には知ることのできない母集団の統計学的な分布や性質を推測する(統計学的推定)ためには、標本統計量が母集団の分布特性を一定の確からしさで示していることが明らかにされなければなりません。それが統計的検定(あるいは単に検定)という作業です。統計的検定の手続きを経ずに標本統計量をもって母集団の特性とすることはできません。例えば、標本数10万人の世論調査で年齢階層ごとにA政党の支持率を尋ね、その結果が、若年者層:支持30%・不支持30%・中間40%、中年者層:支持40%・不支持40%・中間20%、高齢者層:支持45%・不支持35%・中間30%であった場合、検定をせずにその数値だけで「高齢者ほどA政党支持率が高い」と判断することはできません。高齢者層の値が統計的に想定される母集団全体のA政党支持率と明らかに異なる(この場合は「高い」)ことが統計的に示されなければ、そうした結論を導き出すことはできないのです。統計的検定にあたっては、まず、「そのような事実(関係)はない」という趣旨の仮説(帰無仮説)を立てます。その上で、それを統計的に棄却(否定)し、それによって「そのような事実(関係)が存在する」ということを明らかにしていきます。もっとも、正確に表現すれば、統計的検定では事実(関係)の存在を証明するのではなく、事実(関係)の存在の可能性を一定の確率(多くは99%以上ないし95%以上)で示すことになります。
統計的検定の詳細に関しては、「帰無仮説」の項目も参照してください。
調査員が調査対象者を訪問して調査票への回答の記入を依頼し、一定期間調査対象者の手元に調査票を留め置いた後、再訪問して記入内容を点検しながら調査票を回収する調査法です。調査対象者は調査票を読んで、自分で回答を記入する(自記式)ので、じっくり考えたり、正確に調べて回答することができます。自分のペースで回答してもらえるので、質問の量についても比較的融通が利きます。回収に調査員がやって来た際、調査対象者と実際に会って直接協力を依頼できるため、面接調査並みの回収率が期待できます。また、訪問面接調査よりも一人の調査員が多くの調査対象者を担当できるので、費用は総体的に小さくて済みます。
面接調査と組み合わせて実施したり、配票や回収を郵便や宅配便によって行う郵送調査との併用も行われます。ただし、回答が本人のものかどうかの確認ができないことから、誤り、虚偽などの可能性が高くなることや、回答者が調査票を見わたすことができるので、前後の回答が整合化されやすいという欠点があります。
内容分析とは、新聞、雑誌、テレビなどマスメディアが発するメッセージの内容を客観的に分析する体系的な方法です。マス・コミュニケーション研究で使われることが多い方法ですが、マス・コミュニケーション以外にも質問紙調査の自由回答の分析や社会心理学における小集団のコミュニケーション過程の研究から、社会学、政治学、人類学、文学の研究でも用いられ、近年注目されるビッグデータの分析の一部も内容分析ということができます。データの種類としては、新聞や雑誌記事、コンピュータ上のテキストなどの文書データが基本ですが、音声や広告などの画像データ、テレビなどの動画データも使われています。
このように内容分析は、さまざまなデータに活用できる応用範囲の広い分析方法であることのほか、過去の新聞や雑誌などを分析することで、過ぎ去った過去のことを知ることができること、調査対象者に警戒されることなく、調査対象者に影響を与えることなく調査対象を知ることができることが、質問紙調査やインタビュー調査、参与観察と異なる利点です。一方で、明確な目的と仮説、限定された対象、客観的な手順の確立が必要で、手間がかかるわりに得られるものが大きくないと指摘されることもあります。
二次分析とは、データ分析者以外の人や研究グループが収集した、既に公開されたデータを分析することです。二次分析に対し、データを収集した調査主体に属する人が、そのデータを分析することを一次分析といいます。
近年では、日本国内でも社会調査データ・アーカイブの整備が進み、また手軽にWeb上で分析が可能なサイトが作成されたことにより、二次分析を行う環境が整ってきています。二次分析には、データ収集の過程を省略できることによって、仮説構築や分析結果の解釈などにより多くの労力を割けるという利点や他の研究者による分析結果の再現・検証や分析の発展が可能という利点があります。
一方でデータ収集過程を十分に踏まえないデータ分析に陥ったり、自分の分析したい質問文そのままが用意されていることが少なく、代理変数をうまく用いなければならないという難しさがあります。
パネル調査とは、同一の調査対象に一定の期間をおいて、基本的に同じ内容を繰り返したずねる調査のことを指します。パネル調査は、一定期間後に同じ対象集団から改めてサンプリングされて行われる繰り返し調査のように集団単位での変化をとらえることよりはむしろ個々の調査対象者の変化をとらえることが可能になることが第一の特徴です。また過去の情報は、現時点から回顧的にたずねても正確に得られるとは限らないため、正しい因果的影響を検討する上でパネル調査はなくてはならないものです。
パネル調査の欠点としては、調査対象者は、調査を繰り返し受けるとしだいに調査慣れが起き、回答に影響が出るという点や、長期にわたるパネルの維持が容易ではなく、死亡や転居などの脱落によって当初設定した母集団に対するパネルの代表性がしだいに低下するという点があげられます。
また、パネルデータを有効に分析するには、パネルの脱落メカニズムを組み込んだ分析や特別な統計手法を用いた分析が必要とされることも少なくありません。
インタビュー調査において、質問や回答方法があらかじめ決まっていることを「構造化」されているといい、その程度によって、インタビューは、構造化、半構造化、非構造化の3つに分けられます。構造化インタビューは、面接調査における質問方法で、質問は調査票の順番通りにたずねられ、調査者のたずね方の違いによるバイアスが最小限に抑えられます。それに対して、非構造化インタビューでは、質問はあらかじめ決められておらず、インタビューの会話の流れの中で、状況に応じて発せられます。インタビューがテンポよく弾むと、調査者の予想外の展開が得られることもあります。
半構造化インタビューは、構造化インタビューと非構造化インタビューの中間で、質問はあらかじめおおよそ決めてはいるものの、調査者は話題の展開に応じて、質問の順番を変えたり、より詳細な説明をもとめる質問を付け加えたりするなど臨機応変に行うインタビューです。これによって、発見的価値を確保する一方で、得られるデータがある程度構造化されているために、データ分析が容易になる点が非構造化インタビューと異なる点です。
標本調査とは、母集団の一部のメンバーを抽出して実施する調査であり、全数(悉皆)調査とは対になる概念です。標本の抽出法は確率に基づく無作為抽出と確率的でない有意抽出とに大きく分けられます。
無作為抽出をベースとした標本調査は、少数の観測されたデータから、大きな母集団の特徴を知ることを可能にするすぐれた方法です。金銭的・人的コストや時間的コストを全数調査に比べて圧倒的に低く抑えることができるという利点を持っていますが、標本に基づく方法のために標本誤差を評価する必要があります。
有意抽出は、少数の標本しか調査できないインタビュー調査や参与観察などで用いられることが多い方法です。無作為抽出ではないために確率に基づいて、全体(母集団)を推測することには適していませんが、調査した事例の特徴を類型化し、問題を発見したり、項目間の関係を見いだすことに有用な方法です。
フェイス・シートとは、調査対象者の個人的基本属性を把握する項目から構成される調査項目群のことです。
その代表的なものは、調査対象者の性、年齢、学歴、職業、収入などです。これらの基礎的な属性項目は社会調査がはじめられた当初は調査票の冒頭(第1ページ目)におかれたことから、フェイス・シートと呼ばれ、現在でも慣例でこう呼ばれます。
フェイス・シートは個人情報に関わるセンシティブな質問であり、最初にたずねることは、回答率を下げる要因にもなりかねないため、面接調査で対象者を確認するための性と年齢を除いて、調査票のなかに分散して配置したり、最後部にまとめたりすることが多くなっています。
→「市場調査」の項目を参照してください。
ミクストメソッズとは、量的調査データと質的調査データを組み合わせて分析することです。これまで、両者は対立するものと捉えられることもありましたが、近年はむしろ補完しあうものと考えられています。 サーベイ調査のような量的調査は、ランダムサンプリングされた標本でデータ収集し,「どのような分布をしているのか」といった全体像を(一定の誤差の範囲内で)把握することができます。いっぽう、インタビュー調査やフィールド調査や資料分析などの質的調査は、比較的少数の事例でデータ収集し、記述することに優れています。
通常は、どちらか1つの方法でデータ収集しますが、ミクストメソッズなら、同じ母集団に対し、たとえばまずインタビュー調査を実施して仮説を立て、それをサーベイ調査で検証することができます。あるいは逆に、まずサーベイ調査でいくつかの命題が検証されたあと、「なぜそうなのか」をフィールド調査で解明することもできるのです。さらに、これらを組み合わせたり、繰りかえすことで分析を深めることが可能となります。
モノグラフとは、ある対象について、その生活を歴史や政治、文化などのさまざまな過程を参与観察や資料収集、インタビューなどの多角的な方法で調査してまとめた調査記録やレポート、論文のことを指します。日本においては農村社会学で地域研究の方法として、またその記述方法として発達してきたこともあり、その対象は、かつては村落を単位とした研究に多く用いられてきました。その後、移民の家族であったり、都市の暴走族などの集団を単位とする研究などにも応用されていますが、調査対象は、個人や小集団の場合が多く、広範囲の多数の人々が対象となることはあまりありません。
事例研究の一つに位置づけられ、文化人類学でも頻繁に用いられる方法ですが、人類学者による海外の異文化の記述は特にエスノグラフィーという場合もあります。
調査票を調査対象者に送付し、回答者自身が記入した調査票を返送してもらう調査方法です。調査対象者の都合のよい時に回答することができるため、じっくり考えたり、正確に調べたりして回答してもらうことが可能で、質問の量についても比較的融通が利きます。
調査員が不要なため人件費がかからず、費用が面接調査や留置調査に比べてかなり抑えられるのが最大の利点です。
しかし、調査員が調査対象者と接触することがないため、記入漏れや回答の不備などについて調査対象者に確認を求めることができないうえ、回答者が調査票を見わたすことができるので、前後の回答が整合化されやすいという欠点があります。また、調査対象者に実際に会って直接協力を依頼することがないので、調査票の返送率(回収率)は2~4割程度と低い割合にとどまりやすい傾向があります。
回収率が比較的高い留置調査との併用など、他の調査法の利点を生かし、組み合わせて効果を上げる工夫がなされています。
ライフヒストリーとは、個人の人生の体験と本人の意味づけを記録したものです。必ずしも一生すべてではなく、人生の一時期に焦点をあてる場合もあります。調査にあたっては、半構造化インタビューが用いられることが多く、インタビューだけでなく、公文書や手記、伝記、写真、手紙といったさまざまな資料が併用されることも多くあります。ライフヒストリーは、他の人と異なる個人の特異な体験に基づく個別性がおもしろい点ですが、それとともに個別な個人の、歴史的・社会的文脈におかれている普遍性を描くことが必要であり、それがまた難しい点でもあります。
ライフヒストリーには、生活史や個人史など関連用語、派生概念はたくさんありますが、近年注目されている用語は、ライフストーリーです。ライフストーリーとライフヒストリーの2つを対比させるときは、ライフヒストリーはより実証的な手法としてとらえられ、ライフストーリーは、その場での語りの内容のみならず語り手の語り方、聞き手の聞き方、両者の関係などにも注意を払って分析することが強調されます。語り手と聞き手の相互行為である会話を通して、両者によって共同制作される口述のストーリーが重要な意味を持っているという立場の調査方法です。
ラポールとは、調査者と調査対象者との間の信頼関係をいいます。インタビュー調査や参与観察を円滑に行うにあたっては、調査者と調査対象者の間に友好な関係が成立していることが重要です。ラポールが損なわれると、調査の中断や調査結果の公表段階においての差し止めなど、調査にとって致命的な結果を招くこともあります。
ラポールは、調査者が調査の目的と調査手順について説明し、それを調査対象者が理解した上で、調査への協力を了解するなどの、相互の理解の上に成立するものです。また、調査者、対象者双方の個人的な人格がラポール形成に果たす役割は大きいのですが、人格的信頼関係は、時間の経過とともに強くなりがちで、オーバー・ラポールとなる危険があります。オーバー・ラポールの弊害としては、調査者が調査対象者に同化しすぎて観察等の客観性が歪むこと、対象者から個人的相談を受けた場合の対処が難しくなること、研究成果の公表の際、対象者が期待するやり方と異なる場合の対処が難しくなることなどがあげられ、注意が必要です。
ランダムサンプリングとは、母集団に属する個体のすべてが同じ確率(等確率)で選ばれるように計画して標本(調査対象者)を抽出する方法のことです。社会調査の目的は、母集団の特性を知ることにあります。母集団の一部を抽出して実施する調査(標本調査)にあっては、調査で明らかになった結果から母集団の特性を推測することになりますが、そのためには、どの程度の確率で母集団と同様の特性をもつ標本を抽出できるかをあらかじめ把握しておく必要があります。この確率を把握するために不可欠な条件が、母集団に属する個体がすべて同じ確率で選ばれるようになっていることであり、この条件を満たす標本抽出の方法が、ランダムサンプリングなのです。ランダムサンプリングを行っておけば、どの程度の大きさの母集団からどれだけのサイズの標本を抽出した場合に、それがどの程度の確率で母集団に近似するかを客観的に示せます。標本調査の結果から母集団の特性を推測する場合の確実さを評価する上で、換言すれば、どの程度の誤差がどのくらいの割合で起こっているかを見通しつつ母集団の特性を推測する上で、ランダムサンプリングは標本調査にとって不可欠な方法なのです。「ランダムサンプリング」と言うと「でたらめ」であったり「手当たり次第」であったり無計画な印象を持ちますが、それでは標本を等確率に抽出することはできません。「ランダムサンプリング」は、確率理論に基づき同じ確率で標本を抽出するために行われる極めて計画的な方法なのです。なお、ランダムサンプリングの基本は「単純無作為抽出法」ですが、社会調査の場合、規模の大きな母集団から多くの標本を抽出する必要があり、そのために「系統抽出法」「多段階抽出法」「層化抽出法」など、調査の実際に即した様々な方法が開発されています。
ワーディングとは、質問紙調査を行う際に、質問したいことを質問文や選択肢にしていく作業、またはその「言い回し」のことを指します。わずかな「言い回し」の違いによって、回答が大きく異なる場合もあるため、文章の構成や言葉遣いには十分注意をする必要があります。注意すべき点としては、①あいまいな言葉を避け、統一した言葉を使うこと、②専門用語や俗語を避けること、③ダブル・バーレル質問をさけること、④ステレオ・タイプな言葉を含んだ質問を避けること、⑤回答を誘導するようなキャリー・オーバー効果のある質問を避けること、⑥個人的な問題として意見を聞いているのか、一般論としてどう思うかを聞いているのかを明確にすること、などがあげられます。
ワーディングの善し悪しを確認するためには、実際に調査を実施する前にプリテストを行い、分かりにくい表現や答えにくい質問がないかなどをチェックすることが不可欠です。