フリン効果とは？なぜIQスコアは何世代にもわたって上がったの？

もし100年以上前の人たちに現代のIQテストを受けてもらい、今の基準で採点したら、驚くほど多くの人が「平均以下」に見えるはずです。これは、あなたの先祖に失礼に聞こえるかもしれないし、正直それでいいんです。彼らは鉄道を作り、戦争と戦い、家族を育てて、なぜかWi‑Fiなしでも生き延びた。じゃあ一体何が起きてるの？

‍

このパズルは「フリン効果」だよ。20世紀のかなりの期間で、平均IQテストのスコアが世代をまたいで上がっていった、という発見のこと。フリン効果に名前をつけたのは、ニュージーランドの政治哲学者ジェームズ・フリンで、まず1984年にアメリカで大きな伸びを記録し、その後1987年には14カ国へと広がっていました。パターンはシンプルなのに、不思議でもあったんだ。同じ種類のテストでも、新しい世代ほど前の世代より高い点を取りやすかった。

‍

それもほんの少しじゃない。大規模なメタ分析で、Trahan、Stuebing、Hiscock、Fletcherは2014年に、IQスコアがすべての研究を通して1,10年あたり約2.31ポイント増えたと報告しています。さらにWechslerやStanford-Binetみたいな主要テストを使った近年の比較では、1,10年あたり約2.93ポイント増。つまり、聞いたことがあるかもしれない「10年あたり3ポイント」という定番の数字に近いんだ。これが一生分、あるいは2世代分になると、影響はかなり大きくなるよ。

‍

だからこそ、IQテストは定期的に再標準化し続ける必要があります

IQテストは、どこかの永遠の宇宙的な基準で採点されるわけじゃないんだ。採点は「標準化（ノルム）用の集団」に対して行われるよ。たいていは100が平均になるように設定されている。もし、その土台（ベースライン）が何を意味するのかをもっと深く知りたくなったら、平均IQとは何か、そしてそれが意味するものを読んでみてね。これはテストが標準化された当時の人口を前提に決められているんだ。つまり、設計上100が平均。だけど、あとからの世代がテストに慣れていって成績が上がってくると、昔の基準は古くなっていく。ずっとそれを使い続けると、頭の中が一晩で劇的に変わってなくても、書類上は「賢く見える」ようになってくるんだ。

‍

これは技術的な注釈じゃない。現実の世界では大問題です。Trahanらは、古い基準が教育のような重大な判断や、死刑に関わるケースにも影響し得ると指摘しています。ある法的な場面では、数ポイントのIQ差で「知的障害」と見なされるかどうかが変わり得ました。そんなのは「だいたい合ってる」で流していい書類ミスではありません。

‍

つまりフリン効果は「人々が賢くなった」というだけじゃないんだ。もう一つは「測り方のものさし自体がズレ続けている」こと。そこが見えたら、次の疑問は避けられないよね——いったい“何”が上がっていたの？

‍

最大の伸びは、たいてい抽象的な推論で起きていました。

ここから話はいっそう面白くなります。伸びは、あらゆる種類の思考タスクに均等に広がったわけではありません。2015年にジェイコブ・ピーツシュニッヒとマーティン・ヴォラチェクが行った世界的なメタ分析では、流動性知能のテストのほうが、結晶性知能のテストよりも大きな伸びを示す傾向がありました。推定値は、流動性の能力で年あたり約0.41 IQポイントだったのに対し、結晶性の能力は0.21でした。

‍

退屈そうに聞こえるけど、要点はシンプルです。フルイド課題は、新しい問題を解いたり、パターンを見つけたり、抽象的な図形で考えたりします。結晶化課題は、語彙や事実、学んだ知識により重心が置かれます。ティム・フォルジャーは2012年にScientific Americanで、多くの大きな伸びは「類似」と「行列」みたいな課題で見られ、語彙や計算は伸びがかなり緩やかだったと書いています。つまり、現代人は必ずしも“辞書みたいな人”になったわけじゃない。私たちは、特定の考え方が上手になったんです。

‍

フリンは、このことを忘れられない言い方で説明しました。Scientific Americanのインタビューで、彼は「現代の人は“科学的なメガネ”をかけている」と語ったんです。言いたいのは、日常がどんどん私たちを「分類する」「比べる」「抽象化する」「目の前の具体的な体験を離れて考える」よう鍛えていく、ということ。あなたの先祖は、空気のにおいで天気の変化を見抜いたり、配線と粘り強さで機械を直したりする点では、あなたより上だったかもしれません。でも、文脈のないパターンパズルなら、たぶんあなたのほうが有利。おめでとう、って感じです。

‍

それでも、この意味については専門家の見解が分かれます。たとえば心理測定の研究者の一部は、フィリン効果はgの一気な上昇というより、特定のスキルの伸びを反映しているのだと主張しています。詳しくは、一般知能（g因子）が本当に何を意味するのかを扱った記事でも紹介しています。さらに、2024年にAndrzejewskiらが行った最近の研究では、オーストリアでは一部の得点がまだ上がっている一方で、能力の土台となる構造が微妙に変わりつつある可能性も示唆されています。これは進行中の議論で、決着がついた話ではありません。

‍

最も説得力のある説明はすべて、環境に行き着きます

フィン効果が何であれ、遺伝子が進化してそうなった話である可能性はほぼありません。人間の遺伝子は、複数の国で平均のIQテスト成績を10年あたり約3点も押し上げるほど、速く入れ替わることはできません。そもそも知能のどれくらいが遺伝で固定されているのか気になるなら、知能は遺伝するのかを扱った記事でその答えを深掘りしています。しかも時期のスパンだけで、この考えは早い段階で否定されます。

‍

いちばん説得力のある説明は環境要因で、しかも単一の原因というより積み重なっている可能性が高いです。改善された栄養は有力候補。健康の向上も同様ですし、特に子どもの頃が大きいでしょう。家族が小さくなったことで、子ども1人あたりの大人の注意や資源が増えたのかもしれません。より多くの教育も確実に役立ったはずですが、フリンやその後の検討者たちでさえ「教育だけでは、この規模の伸びは説明できない」と主張しています。2015年にピーツニッヒ＆フォラツェクが結論づけたように、最も筋の通った話は「魔法のレバー1つ」ではなく、幅広い環境の変化が組み合わさったものです。

‍

現代の暮らしには、もっと広い「質感」もあります。今あなたは、地図、インターフェース、記号、図解、カテゴリ、画面、そしてルールに基づく仕組みに囲まれて育ちます。子どもの遊びさえも変わりました。今の子どもは、大人になる前（時には靴ひもをちゃんと結ぶ前）から、抽象的なビジュアルの世界を何年も渡り歩きます。人間の発達って、カオスだけど傑作ですね。こうした環境は、気づかないうちに、多くのIQテストが評価する“まさにその力”を鍛えているかもしれません。

‍

環境説を裏づける、もっと直接的な証拠もあります。2018年のPNASの研究で、ベルント・ブラッツバーグとオーレ・ロージェベルグはノルウェーの徴兵データを分析し、IQスコアの上昇とその後の低下の両方が、同じ家族内で、異なる年に生まれた兄弟を比べることで説明できると見つけました。兄弟は親を共有し、背景の多くも共通しているからです。もしこの傾向が家族内で見えるなら、変わる国の遺伝子や移民を原因にするのはかなり難しくなります。結論ははっきりしていて、「フリン効果」もその反転も、どちらも環境によって引き起こされたということでした。

‍

現代の状況は、昔ながらの物語よりもっとごちゃごちゃしてる

ここから「きれいにまとまった見出し」を壊すパートに入ります。前半が「現代生活でスコア上昇」なら、後半は「どこでも、ずっとではない」。いくつかの国、特に北欧の一部では、この傾向が鈍化したり、横ばいになったり、さらには逆転したりしています。

‍

2016年にDutton、van der Linden、Lynnが行ったレビューでは、7か国にまたがる9つの研究で「フィリン効果」のマイナスが報告されていることが確認されました。BratsbergとRogebergのノルウェーのデータでは、1960年代初めから1970年代半ばに生まれたコホートで伸びが見られ、その後は減少に転じました。PietschnigとVoracekも、近年の数十年では伸びが鈍化してきたという証拠を見つけています。

‍

さらにややこしくなります。2019年にPlatt、Keyes、McLaughlin、Kaufmanが、全米の10,000人超の思春期（アメリカの青年）を使って行った研究では、フィリン効果はまったく一様ではないことが分かりました。13歳では1年ではなく“1◯◯年あたり約2.3ポイント”の伸びが見られたのに、18歳までには、その流れが反転して“1◯◯年あたり約1.6ポイントの低下”に。成績の高い子は伸びましたが、一方で一番点が低いグループは実際に後退しています。だから誰かが「フィリン効果」を“どこでも、誰でも、いつでも同じように起きるもの”みたいに話してきたら、にっこり目を細める合図です。

‍

同時に、その効果がどこでも消えたわけではありません。アンドリジェフスキと共同研究者は、2005年から2018年のオーストリアのデータで、IQのあらゆる領域にわたってポジティブなフリン効果が見られることを報告しています。さらに2010年のピーツニッヒ、フォルマン、フォラツェクによる先行研究でも、ドイツ語圏のサンプルで大きな伸びが確認されました。つまり今の状況は複雑です。まだ伸びる地域もあれば、足踏みする地域もあり、下がる地域もあります。

‍

それでも、私たちは本当に祖父母より賢いの？

はい、いいえ、そして厄介なことに、その両方。

‍

平均すると、私たちはIQテストが人に求める多くの課題で、明らかにより得意です。その根拠はしっかりしています。何百万もの人々、そして多くの国にわたって、スコアの伸びは本物でした。とはいえ、それが私たちが「知能」と呼ばれるあらゆる重要な意味で、すべてにおいて優れていることを自動的に意味するわけではありません。

‍

さっき見たことを思い出して。最大の伸びは、たいてい抽象的で非言語の課題に現れていました。ここ、ポイントです。これは、現代の文化が人々にもたらす「考え方のスタイル」を変えた、というフリンの見方を支えています。私たちは、分類したり、仮説を比べたり、記号を操作したりするのが得意になっているかもしれません。これは大事です。ウソじゃありません。とはいえ、それは「人間が今、より知恵を持つ」「判断がより良い」「創造性が深い」「常識が強い」と証明することとは別です。もしIQテストが「午前2時にくだらない投稿をしない力」まで測れたら、文明はもっと元気に発展しているはずです。

‍

このテーマをもう少し深掘りして、現実の法的リスクや、あなた自身のIQスコアを調整するための実用的な計算式まで知りたいなら、「世代ごとに、前の世代より賢くなっている」理由に関する記事でそのポイントをまっすぐ解説しています。

‍

だからこそ、フィン効果が一般知能の“単純な上昇”を示していると言い切ることに抵抗する研究者もいるんだ。伸びは、現代の心と現代のテストの相性がよくなったことが一部関係しているかもしれない。とはいえ、これは十分に興味深い。つまり、知能指数は昔思われていた以上に、文化や発達によって大きく左右されるってことだよ。

‍

なぜ心理士はこれにこんなにこだわるの？

フリン効果は分野を変えました。というのも、うまくいっていた前提が崩れたからです――IQスコアは、固定された知的特性の“変わらないスナップショット”だ、という思い込みです。ところが実際には、スコアは歴史的な変化に驚くほど敏感だったのです。

‍

2015年に心理学者ティモシー・サルソウスが示したように、こうした世代間の変化は、認知的な老化を研究する際にも話をややこしくします。同じ年齢で、後に生まれた人のほうが先に生まれた人より高いスコアを出すなら、見かけの年齢差は「純粋な老化」ではなくコホート（世代）効果を反映している可能性があります。つまり、フリン効果が研究に紛れ込み、時間そのものが悪者に見えてしまうこともあるんです。

‍

実用面の影響はまだ続きます。古い基準はスコアを膨らませ、特別支援教育の認定を遅らせ、臨床での判断をゆがめ、法的な判断にも影響します。だからこそテスト提供者は基準を更新し続け、優秀な心理士は「最後の数字」だけでなく「テストのどの版が使われたか」を大事にします。文脈なしのIQスコアは、傾いた床のバスルームの体重計みたいなものです。測れてはいるけど、法廷で使う根拠としては望ましくない可能性があるんです。

‍

フリン効果は、もっと大きく希望のある考えも残してくれます。人間の認知能力は、世界から切り離されたものではありません。栄養、教育、健康、複雑さ、期待――十分に世界を変えれば、心（＝考え方）も変わるのです。だからこそ、変わらない限界を断言するような大げさな主張には慎重であるべき。でも、簡単な楽観にも同じく慎重でいる必要があります。さっきも言ったように、伸びは止まることがあるからです。環境は心の成長を後押しもしますが、助けが効かなくなることもあります。

‍

それが、僕にとって本当の学びだよ。フリン効果は、IQテストへの好奇心だけじゃない。人の思考が「歴史」とともにあるものだという気づきでもある。私たちの心は、周りに築く世界によって形づくられるんだ。そこで、ちょっと気まずい次の疑問が出てくる——いまの私たちの世界は、いったい何を得意にするよう鍛えてくれてるの？

‍