レイヴンの進行マトリックスは、最も広く使用されているIQテストの一つです。私たちは、存在する3つの異なるタイプ、その歴史と改善点を探り、いくつかの問題の例を通じて、最後にその利点と欠点を見ていきます。10分以内に、このテストタイプのプロフィールについて非常に良いアイデアを得ることができるでしょう。
ラベンテストの紹介
一般的には単一のテストとして理解されていますが、レイヴンマトリックスは実際には同じタイプの質問を持つ3つの異なるテストです。最初は5歳から11歳の子供向けのカラー進行マトリックス(CPM)です。次は11歳から成人の終わりまでの標準進行マトリックス(SPM)です。そして3つ目は高度進行マトリックス(APM)で、名前が示すように、より高度で複雑なマトリックスがあり、高い知能を持つとされる人々を対象としています。
すべてのテストは一連の質問で構成されています。各質問には、要素が1つ以上のパターンに従うマトリックスがあります。マトリックスの一部が欠けており、提示された選択肢の中から最も適したものを選んで埋める必要があります。
例えば、APMには36のマトリックス問題があり、それぞれの問題には8つの選択肢があります。一般的に40分の制限時間がありますが、無制限のバージョンもあります。前者は能力の幅を測定し(無制限)、後者は知的パフォーマンスと効率に焦点を当てています(制限時間あり)。
新しい質問が増えるごとに、難易度が上がり、「より複雑な推論の種類」が求められます。やがて、どんな新しいマトリックスも解くには難しすぎる閾値に達します。
CPMは子供向けのカラーバージョンですが、実際には色は全く重要ではなく、問題を解くのに役立ちません。色を使う唯一の目的は、タスクを行う際にモチベーションを高く保つことです。これらの色に基づくテストは、高齢者や障害者にも使用されています。
マトリックスのIQテストの誕生
1938年、心理学者J.レイヴンは、テストの最初のバージョンである標準版を作成しました。若い心理学者として、彼は知能遺伝子の探索において師であるペンローズ教授を手助けしていました。当時存在していたテストの複雑さは研究を困難にし、レイヴンによって発明された新しいテストが、迅速かつ簡単、そしてコスト効率よく知能を評価する方法として求められました。
子供向けのバージョン(CPM)と高知能者向けのバージョン(APM)は、どちらも後に開発され、1947年に発表されました。この年、テストは48問から36問に減少しました。多くの質問がIQの差別化に役立たないことが判明したためです。その後、いくつかの改訂が行われ、有効性が向上し、新しい質問が発表されました。
レイヴンの見解では、テストは「比較を形成し、類推によって推論し、以前に得た情報に関係なく論理的な思考方法を発展させる能力」を測定することを目的としていました。キャッテルのような他のテスト作成者と同様に、レイヴンも教育的および文化的影響から自由なテストを作成しようとしました。
しかし、私たちは現在の知識をもとに過去を再解釈したくなるかもしれません。実際には、彼はテストが一般的な知能を測定しているとは考えておらず、各問題が特定の思考システムをテストしていると考えていました。
彼の定義によれば、知能とは、(i) 必要な情報を思い出し、(ii) 比較を形成し、類推によって推論する能力を持って、あらゆる状況で行動する能力でした。したがって、レイヴンは知能を2つの要素から成るものと見なしていたと言えます。そのため、彼はマトリックスに加えてミルヒル語彙テストを用いて知能を測定しました。後に、全体的な知能結果とマトリックステストとの高い相関関係が、これらのテストのうちの1つだけを十分な予測として使用することを支持することになります。
マトリックスの質問
各質問は常に9つのセルを持つ3x3のマトリックス矩形です(簡単なバージョンでは2x2の場合もあります)。各セルには1つ以上のアイテム(円、三角形、矢印など)があり、右下のセルは空です。空のセルを埋めるために、参加者は8つの選択肢の中から選ぶ必要があります。
各セル内の異なる項目間および他のセルの項目との関係から、回答者はどのルールや関係が存在するかを推測し、したがってどの回答がマトリックスを最も適切に満たすかを導き出さなければなりません。正しい答えは一意であり、常に一つの明確な関係(または関係のグループ)が存在し、それが唯一の可能な答えに導きます。
基本的な例を二つ見てから、必要な最も一般的な推論のタイプに入っていきましょう。まず最初のマトリックス:
各行には同じ種類の要素があることがわかります。最初の行はすべて円、2番目の行はすべて三角形、最後の行には2つの長方形があります。選択肢は次の通りです。
必要な推論:したがって、最後の空のセルは、行の他の2つと同じタイプ、すなわち色のない長方形である必要があります。これにより、Aが唯一の選択肢となります。Bを選ぶのは間違いです。他の図形は色で塗りつぶされていないからです。以下に、正しい答えでの完全なマトリックスの結果を示します。完全なマトリックスは次のようになります:
さて、もう一つの例を見てみましょう。少し複雑です。
今回は、各行が同じタイプの要素を持っていることが再び見られます。しかし、右に行くにつれて、図は内部がより色で満たされていきます。
私たちが選ぶべき選択肢は次のとおりです:
必要な推論:このマトリックスは2つのルールを組み合わせているようです。1つは各行で同じ種類の図形を維持すること。もう1つは、各列で図形の内部を隠すことで、右に行くほどその程度が増すことです。つまり、Bを選ぶべきです。なぜなら、それは行の図形と同じ長方形であり、さらに左の列にすでに現れた明るい塗りの他の2つよりも暗いからです。解答を見てみましょう:
必要な推論の種類
すでに述べたように、抽象的なレベルでは、このテストは演繹的および帰納的推論を行う能力を測定します。必要な推論の具体例は次のとおりです:
- 図の類似点と相違点を区別し、それらが各セルにどのように影響するかを理解する
- 知覚フィールド内の図形の方向を、他の図形との関係で評価する
- 全体を形成する方法を認識する
- 図の部分を分析し、各ケースで重要な要素を区別する
- マトリックスの各部分におけるアナログの変化を比較する
あまり多くの具体的なパターンやルールを明らかにすることは、テストの整合性を損なうためできません。しかし、問題にしばしば現れる最も基本的なルールのいくつかを例として挙げることはできます。
- 一貫性:物語が一つの要素でしか意味を成さない子供の質問に典型的です。
- 同一のコンポーネント:コンポーネントが上記の例のように等しいままであるべきとき。
- 連続パターン:人は列や行によってどのパターンが続いているかを見つける必要があります(例:各列で図形が右に回転するなど)。
- 数学的操作の適用:各列が要素の数を2倍に持つときのように。
- 関係と組み合わせ:たとえば、異なるセルの要素が結合してより複雑なアイテムを形成する場合です。
問題に対する解決策は正しいことが多いですが、推論に欠陥があります。答えが正しかったかもしれませんが、次の質問は正しく解決されない可能性が高いです。では、エラーが挙げられたので、テストを受ける際の最も一般的な間違いは何でしょうか?二つの一般的なエラーは:
- 不完全な相関:人がマトリックス内で働いているすべてのルールやパターンを明らかにできないとき。複雑な質問でよく見られます。
- アイデアの収束:無関係な詳細が無視されるべきだったのに無視されなかった場合。例:サイズパターンを使用するべきではなかったのに、影響を受けたのは2つの要素だけだった。
いつ使用すべきですか?
カラステストは、教育、実験、臨床の場で使用されます。しかし、その使用は、高精度が必要ない決定や文脈に制限されるべきであり、シンプルでコスト効果の高いテストが必要です。例えば、このテストは、正確なIQが研究の主な目的でない心理学研究で非常に一般的です。しかし、重要な決定が人の生活に影響を与える可能性がある広範な臨床評価には使用されません。
年齢に応じて、子供用バージョン(CPM)または大人用バージョン(SPMまたはAPM)を使用する必要があります。教育の文脈で、子供の知能を基本的に予測するために使用されることが非常に一般的です。例えば、アドバンスドマトリックスバージョン(APM)は高等教育でも広く使用されています。
妥当性と信頼性
テストは信頼性がありますか?テストの重要な2つの側面は、妥当性と信頼性です。信頼性は、テストに測定誤差があるかどうか、つまり「再度テストを行った場合、同じ結果が得られるか?」を示します。そして妥当性は、実際に知能を測定しているかどうかを教えてくれます。テストの結果は良好な学業成績と相関していますか?テストの結果が良いほど、成功するキャリアの可能性が高まるのでしょうか?
その点において、レイヴンテストはかなり良い信頼性を持ち、80%から90%の範囲にあるため、測定誤差は小さいです。有効性については、テストが有効かどうかを確立する一般的な方法は、その結果をより確立されたテストと比較することです。さて、より強力なウェクスラー尺度と比較すると、相関関係は実際にかなり良好で、約55%から70%です。しかし、前述のように、どんな目的でもテストを使用するには十分ではありません。
省略形
テストは40分かかるため、状況によっては長すぎることがあります。そのため、専門家は短く、より迅速に実施できるいくつかの短縮版を作成しました。
12分で12問だけで構成されたテストを作成するというアプローチ(ArthurとDay, 1994)がありました(元のテストの36問のうち33%)。実際に難易度の飛躍がある問題のみを選択しています。
しかし、一部の心理学者はこのアプローチを批判しています。なぜなら、より難しい問題を解くことは通常、以前の問題からの簡単なパターンを解くことに依存しているからです。そこで、参加者には20分の制限時間と異なるスコアリングスケールで元の問題セットが提供される新しいバージョンが登場しました。
両方のオプション はIQを予測するのに優れた結果を示していますが、もちろん元のバージョンほどではありません。
強みと弱み
その強みとして、非常に簡単に実施でき、かなり迅速に行えます。これにより、大規模なグループを広範で高コストな努力なしにテストできるため、そもそもレイヴンによって作られた理由です。また、テストにはほとんど指示がなく、完全に非言語的であるため、異なる背景や教育レベルからの偏見なしに人々を比較できます。
否定的な見方をすれば、最も大きな弱点は流動知能に焦点を当てており、他の多くの認知能力を評価していないことです。事前の知識なしに推論や帰納を行うことが最も予測的な能力であることは確かですが、包括的ではありません。これが、ウェクスラー尺度が妥当性で勝り、より正確な予測に使用される理由です。これは、より長く、より包括的なバッテリーだからです。
別の弱点は、文化に配慮したものであるにもかかわらず、国間の結果の違いが十分に強く、比較するためのローカルスケールを作成する必要があることです。これにより、文化に配慮した仮説は部分的に疑問視されます。社会経済的要因が高い認知発達に何らかの形で関連しているようで、良好な栄養や健康の向上を通じて影響を与えているかもしれません。また、特にアフリカのように両者の間に大きな違いがある国では、農村と都市の市民の間にも違いがあります。
要約
私たちが見たように、レイヴンIQテストは、あらゆる知能テスターのツールボックスにおいて強力な道具です。迅速に提供でき、低コストで、実施も簡単です。しかし、その使用は、近似的な予測のみが必要なケースに制限されています。流動性知能という1つの知能因子のみをテストするため、知能と高い相関があるにもかかわらず、個人の能力を評価するにはかなり限られたものです。
.png)




.png)
.png)






.png)


