IQテストが測るもの、測らないもの

文：hmmm.me editorial team · 公開日：2026年4月19日

IQは奇妙な数字です。

これは心理学において最も研究されている変数のひとつです。学業成績、特定の職務遂行能力、特定の疾患リスクなどを、自己申告に基づく分野のほぼいかなる要素よりも確実に予測します。同時に、インターネット上では武器として使われ、ミーム化され、個人攻撃の材料にされ、5分間で20問のマトリックスパズルを解いたすべての人に配られる数字でもあります。

この記事は、IQとは実際には何であり、何ではないのか、そしてスコアが本当に教えてくれることはどの程度なのかを説明する試みです。

ごく短い歴史

1905年、アルフレッド・ビネーというフランスの心理学者が、パリの公立学校から特別な支援を必要とする子どもを特定する方法の開発を依頼されました。彼は年齢別に分類された一連の問題を作成しました。子どもの「精神年齢」を生活年齢（実年齢）と比較することで、学習に苦労している子どもを見つけ出せるようにしたのです。それは、子どもの発達を視野に入れ、慎重に使用されるよう設計された診断ツールでした。

その後、ウィリアム・シュテルンが、精神年齢を生活年齢で割り、それに100を掛けるという「知能指数（Intelligence Quotient）」を提案しました。スタンフォード大学のルイス・ターマンは、ビネーのテストをアメリカ向けに改変し、スタンフォード・ビネー検査が誕生しました。後にデビッド・ウェクスラーが成人向けのWAISを追加し、これが今日でも最も広く使われている臨床用IQ検査となっています。

つまり、元々のテストは、個別に行われる慎重な診断ツールでした。それからの120年間に起こったことはすべて、ビネーが支持しなかったであろう方向へとこのツールが引っ張られていった物語です。

IQテストが実際に機能する仕組み

WAIS-IVのような現代のテストは、言語理解、知覚推理、ワーキングメモリー、処理速度といった複数の領域にわたる幅広い推論タスクを抽出します。タスクは慎重に時間を計られ、標準化サンプル（年齢や人口統計学的に合致させた、一般人口の大規模な断面）と照らし合わせて採点されます。

スコアは絶対的なものではなく、相対的な位置を示すものです。「IQ 115」は、「あなたが115の単位分だけ賢い」という意味ではありません。「同年齢の母集団と比較して、平均より1標準偏差高いスコアを出した」という意味です。100という数字は恣意的なもので、構造上、集団の平均値として定義されています。15という標準偏差も同様に構造上のものです。

テストはサンプルを基準に標準化されているため、スコアは数十年ごとに再標準化されます。これは、よく知られた奇妙な現象によるものです。過去1世紀の間、生のIQスコアは10年ごとに約3ポイントずつ上昇してきました。これはフリン効果と呼ばれており、データを掘り下げて誰も気づいていなかったこの事実を指摘した心理学者ジェームズ・フリンにちなんで名付けられました。

なぜフリン効果が起こるのか、完全に理解している人は誰もいません。栄養状態の改善、学校教育の普及、日常生活における抽象的思考の要求の増加、家族の小規模化、そして小児疾患の減少などが、すべて関与していると考えられています。これが意味するのは、今日生まれた子どもは、生データの時点で、祖父母が同じ年齢のときに受けた同じテストよりもかなり高いスコアを出すということです。そして、IQは100を基準にしているため、平均値を適切な位置に保つよう、テストを定期的に再調整しなければならないのです。

IQが予測するもの

IQは約1世紀にわたってさまざまな結果と相関付けられてきました。その全体像は概ね以下のようになります。

認知的な負荷が高いタスクの成績を強く予測する。学校の成績、標準テストのスコア、情報量の多い仕事でのパフォーマンスなど。
一般的な仕事のパフォーマンスを中程度に予測する。仕事の認知的負荷が低くなるにつれて、この効果は小さくなる。
学歴の要因を除外すると、収入を弱く予測する。裕福な親を持つ賢い子どもは、並外れた優位性を持っている。
安定した仕事に就けるかどうかに認知能力が影響する水準を超えると、幸福度は予測しない。
一定の基準を超える知恵や創造性、あるいはほとんどの対人関係の資質は予測しない。

ここから読み取るべきことは、IQが万能だということではありません。IQは実在し、重要であり、そして数多くある変数のひとつに過ぎないということです。

手軽なオンラインの「IQテスト」が実際に測るもの

このサイトにあるような20問のクイズは、実際のIQテストで測定される推論タイプのうち、1つか2つを抽出したものです。これは標準化されていません。あなたのスコアは、特定の母集団サンプルと比較して調整されるのではなく、これら特定の質問に対するパフォーマンスに基づいて計算されます。

オンラインクイズのスコアは何を教えてくれるのでしょうか。正直なところ、わずかなことだけです。それらのパズルを簡単だと感じたか、普通か、難しいと感じたかをざっくりと教えてくれるに過ぎません。臨床的な検査でどの程度の位置につくかを教えてくれるわけではありません。違う日に2回クイズを受けたら、意味のあるレベルで異なるスコアが出るでしょう。

本当の測定を望むなら、臨床心理士、数時間の時間、そしてそれなりの費用が必要です。ほとんどの人にとって、大抵の場合、それだけの価値はありません。

その数字の文化的な重みについて

言及しておく価値があるため、最後にもうひとつ。IQには、人種、階級、移民、そして誰が何を得るに値するかについての偏見を正当化する道具として使われてきた、長く醜い歴史があります。その歴史の一部は今も続いています。現代の慎重な心理学者はそのことを十分に認識していますが、不用意な評論家はそうではありません。

もしこのクイズで低いスコアが出たとしても、あなたが愚かだということではありません。検証済みのあらゆるIQ測定には、広い誤差の範囲と、大きな日々の変動があります。インターネット上の20問のクイズであれば、その誤差はさらにずっと広くなります。そして、慎重に行われる臨床的な測定でさえ、特定の認知タスクにおけるパフォーマンスについて教えてくれるだけであり、それは「あなたがどれくらい賢いか」よりも狭い意味しか持ちません。

高いスコアが出たなら、それは素晴らしいことですが、人生を支えるほどのものではありません。認知能力は重要ですが、賢くても不幸だったり、役に立たなかったり、行き詰まったりしている人たちのリストは膨大です。

パズルはあくまでパズルとして捉えてください。解けたものを楽しみ、解けなかったものには好奇心を持ち、そして次へ進みましょう。

手軽なパズルセットに挑戦する — 20問、約5分。