Ma trận tiến bộ của Raven là một trong những bài kiểm tra IQ được sử dụng rộng rãi nhất. Chúng ta sẽ khám phá ba loại khác nhau, lịch sử và những cải tiến của chúng, cùng với một số ví dụ câu hỏi, và cuối cùng là những ưu điểm và nhược điểm của chúng. Chưa đầy mười phút, bạn sẽ có một cái nhìn rất rõ về đặc điểm của loại bài kiểm tra này.
Giới thiệu về các bài kiểm tra Raven
Mặc dù thường được hiểu là một bài kiểm tra duy nhất, Ma trận Raven thực chất là ba bài kiểm tra khác nhau với cùng loại câu hỏi. Bài kiểm tra đầu tiên là Ma trận Tiến bộ Màu sắc (CPM) dành cho trẻ em từ năm đến mười một tuổi. Bài kiểm tra thứ hai là Ma trận Tiến bộ Chuẩn (SPM) từ mười một tuổi cho đến hết tuổi trưởng thành. Và bài kiểm tra thứ ba là Ma trận Tiến bộ Nâng cao (APM), mà -như tên gọi đã gợi ý- có các ma trận phức tạp và nâng cao hơn, dành cho những người được cho là có trí thông minh cao.
Tất cả các bài kiểm tra đều bao gồm một tập hợp các câu hỏi. Trong mỗi câu hỏi, bạn sẽ thấy một ma trận mà các phần tử tuân theo một hoặc nhiều mẫu. Một phần của ma trận bị thiếu và cần được điền bằng cách chọn trong số các lựa chọn được đưa ra - trong đó chỉ có một lựa chọn phù hợp nhất.
Ví dụ, APM có 36 câu hỏi ma trận, và mỗi câu hỏi cung cấp tám lựa chọn. Thời gian giới hạn thường là 40 phút, nhưng cũng có phiên bản không giới hạn thời gian. Phiên bản trước đo lường nhiều hơn về phổ năng lực (không giới hạn thời gian) trong khi các phiên bản sau tập trung vào hiệu suất và hiệu quả trí tuệ (có giới hạn thời gian).
Với mỗi câu hỏi mới, độ khó tăng lên, yêu cầu “các loại lý luận phức tạp hơn” cho đến khi người đó đạt đến ngưỡng mà bất kỳ ma trận mới nào cũng quá khó để giải quyết.
Mặc dù CPM là phiên bản có màu dành cho trẻ em, nhưng thực tế, màu sắc không có ý nghĩa gì cả, vì chúng không giúp giải quyết các vấn đề và mục đích duy nhất khi sử dụng chúng là để giữ động lực cao trong khi thực hiện nhiệm vụ. Những bài kiểm tra dựa trên màu sắc này cũng được sử dụng với người cao tuổi và những người khuyết tật.
Sự ra đời của các bài kiểm tra IQ Matrices
Vào năm 1938, nhà tâm lý học J. Raven đã tạo ra phiên bản đầu tiên của bài kiểm tra, phiên bản tiêu chuẩn. Là một nhà tâm lý học trẻ, ông đã giúp thầy của mình, giáo sư Penrose, trong việc tìm kiếm gen thông minh. Sự phức tạp của các bài kiểm tra tồn tại lúc bấy giờ đã gây khó khăn cho việc thực hiện nghiên cứu và thúc đẩy việc phát minh ra bài kiểm tra mới của Raven như một phương pháp đánh giá trí tuệ nhanh chóng, dễ dàng và tiết kiệm chi phí.
Phiên bản dành cho trẻ em (CPM) và phiên bản dành cho người có trí thông minh cao (APM) được phát triển sau đó, công bố vào năm 1947. Cũng trong năm này, bài kiểm tra đã được giảm từ 48 xuống 36 câu hỏi, vì nhiều câu hỏi không giúp phân biệt chỉ số IQ. Sau này, nhiều bản sửa đổi đã xuất hiện, cải thiện tính hợp lệ và công bố các câu hỏi mới.
Theo quan điểm của Raven, các bài kiểm tra nhằm đo lường “khả năng hình thành so sánh, lý luận bằng phép tương tự và phát triển phương pháp tư duy logic, bất kể thông tin đã được tiếp thu trước đó”. Như chúng ta đã thấy với các nhà sáng tạo bài kiểm tra khác như Cattell, Raven cũng cố gắng tạo ra một bài kiểm tra không bị ảnh hưởng bởi giáo dục và văn hóa.
Tuy nhiên, chúng ta có thể bị cám dỗ để diễn giải lại quá khứ bằng kiến thức hiện tại của mình, vì thực tế là ông chưa bao giờ nghĩ rằng bài kiểm tra đo lường trí thông minh tổng quát mà mỗi vấn đề lại kiểm tra một hệ thống tư duy cụ thể.
Trong định nghĩa của mình, trí thông minh là khả năng hành động trong bất kỳ tình huống nào với (i) sự hồi tưởng thông tin cần thiết và (ii) việc hình thành so sánh và lý luận bằng phép tương tự. Do đó, chúng ta có thể nói rằng Raven coi trí thông minh bao gồm hai thành phần. Và đó là lý do ông đo lường trí thông minh bằng cách sử dụng thêm bài kiểm tra từ vựng Mill Hill bên cạnh các ma trận. Sau này, mối tương quan cao giữa kết quả trí thông minh toàn cầu và bài kiểm tra ma trận sẽ hỗ trợ việc sử dụng chỉ một trong những bài kiểm tra này như một dự đoán đủ tốt.
Câu hỏi về Ma trận
Mỗi câu hỏi luôn là một hình chữ nhật ma trận 3x3 với chín ô (đôi khi là 2x2 cho các phiên bản dễ hơn). Trong mỗi ô có một hoặc nhiều mục (như hình tròn, hình tam giác, mũi tên,...) và ô dưới cùng bên phải thì trống. Để điền vào ô trống, người tham gia phải chọn trong số tám câu trả lời có thể.
Từ mối quan hệ giữa các mục khác nhau trong mỗi ô và với các mục của các ô khác, người tham gia phải suy luận hoặc suy diễn các quy tắc và mối quan hệ tồn tại, do đó xác định câu trả lời nào phù hợp nhất với ma trận. Câu trả lời đúng là duy nhất, vì luôn chỉ có một mối quan hệ rõ ràng (hoặc nhóm mối quan hệ) dẫn đến chỉ một câu trả lời khả thi.
Hãy xem hai ví dụ cơ bản trước khi chúng ta đi sâu vào các loại lý luận phổ biến nhất. Bây giờ là ma trận đầu tiên:
Như chúng ta thấy, mỗi hàng có cùng loại yếu tố. Hàng đầu tiên toàn là hình tròn, hàng thứ hai toàn là hình tam giác, và hàng cuối có hai hình chữ nhật. Các lựa chọn phản hồi để chọn là
Lý do cần thiết: Vậy ô trống cuối cùng phải cùng loại với hai ô còn lại trong hàng, đó là hình chữ nhật không có màu. Điều đó khiến A trở thành lựa chọn duy nhất khả thi. Chọn B sẽ là một sai lầm vì không có hình nào khác được tô màu. Dưới đây bạn có thể thấy ma trận đầy đủ sẽ có kết quả với câu trả lời đúng. Ma trận đầy đủ sẽ là:
Bây giờ hãy xem một ví dụ thứ hai, phức tạp hơn một chút.
Lần này, chúng ta có thể thấy rằng mỗi hàng đều có cùng một loại yếu tố. Nhưng cũng với mỗi cột sang bên phải, hình ảnh trở nên đầy màu sắc hơn bên trong.
Các lựa chọn mà chúng ta phải chọn là:
Lý do cần thiết: Ma trận dường như kết hợp hai quy tắc. Một là duy trì cùng một loại hình trong mỗi hàng. Thứ hai, là làm mờ phần bên trong của hình trong mỗi cột, càng nhiều hơn khi sang bên phải. Điều đó có nghĩa là chúng ta nên chọn B, vì nó là một hình chữ nhật như các hình trong hàng, nhưng cũng tối hơn hai hình còn lại, đã xuất hiện ở các cột bên trái với màu sáng hơn. Hãy xem giải pháp:
Các loại lý luận cần thiết
Như chúng tôi đã đề cập, ở mức độ trừu tượng, bài kiểm tra đo lường khả năng thực hiện cả lý luận suy diễn và quy nạp. Một số ví dụ cụ thể về lý luận cần thiết sẽ là:
- Phân biệt sự tương đồng và khác biệt trong các hình ảnh và hiểu cách chúng ảnh hưởng đến từng tế bào.
- Đánh giá sự định hướng trong một trường cảm nhận của hình ảnh liên quan đến chúng và các hình ảnh khác.
- Nhận thức cách các hình dạng có thể tạo thành một tổng thể
- Phân tích các phần của hình ảnh và phân biệt những yếu tố quan trọng trong từng trường hợp.
- So sánh những thay đổi tương tự trong từng phần của ma trận
Chúng tôi không thể tiết lộ quá nhiều mẫu và quy tắc cụ thể mà các bài kiểm tra sử dụng mà không làm tổn hại đến tính toàn vẹn của chúng. Nhưng chúng tôi có thể đề cập hoàn hảo một số quy tắc cơ bản thường xuất hiện trong các bài toán như một ví dụ:
- Tính nhất quán: điển hình cho những câu hỏi của trẻ em, trong đó một câu chuyện chỉ có thể có ý nghĩa với một yếu tố duy nhất.
- Các thành phần giống hệt: khi một thành phần nên giữ nguyên như trong ví dụ chúng ta đã thấy ở trên.
- Mẫu liên tục: người tham gia cần tìm ra mẫu được theo dõi bởi các cột hoặc hàng (ví dụ: hình ảnh xoay sang phải trong mỗi cột, v.v..)
- Việc áp dụng một phép toán: như khi mỗi cột có gấp đôi số lượng phần tử.
- Mối quan hệ và sự kết hợp: ví dụ khi các phần tử của các ô khác nhau kết hợp để tạo thành một mục phức tạp hơn.
Thường thì giải pháp đưa ra cho vấn đề là đúng nhưng lý do lại sai. Có thể câu trả lời là đúng, nhưng rất có thể câu hỏi tiếp theo sẽ không được giải quyết chính xác. Vậy, giờ đây khi đã đề cập đến lỗi, những sai lầm phổ biến nhất khi làm bài kiểm tra là gì? Hai lỗi thường gặp là:
- Mối tương quan không đầy đủ: khi người đó không thể tiết lộ tất cả các quy tắc và mẫu đang hoạt động trong ma trận. Thường gặp trong các câu hỏi phức tạp.
- Sự giao thoa của các ý tưởng: khi những chi tiết không liên quan lẽ ra nên bị bỏ qua nhưng lại không. Ví dụ: sử dụng một mẫu kích thước khi lẽ ra nên bị bỏ qua vì chỉ có hai yếu tố bị ảnh hưởng.
Chúng nên được sử dụng khi nào?
Các bài kiểm tra Raven được sử dụng trong các môi trường giáo dục, thí nghiệm và lâm sàng. Tuy nhiên, việc sử dụng chúng nên được giới hạn trong các quyết định hoặc bối cảnh mà độ chính xác cao không cần thiết và một bài kiểm tra đơn giản, tiết kiệm chi phí là cần thiết. Ví dụ, bài kiểm tra này khá phổ biến trong nghiên cứu tâm lý khi IQ chính xác không phải là mục tiêu chính của nghiên cứu. Nhưng nó không được sử dụng cho các đánh giá lâm sàng mở rộng, nơi các quyết định quan trọng có thể ảnh hưởng đến cuộc sống của một người.
Tùy thuộc vào độ tuổi, bạn nên sử dụng phiên bản dành cho trẻ em (CPM) hoặc phiên bản dành cho người lớn (SPM hoặc APM). Thường thì nó được sử dụng trong bối cảnh giáo dục để có dự đoán cơ bản về trí thông minh của trẻ. Phiên bản Advanced Matrices (APM) cũng được sử dụng rộng rãi trong giáo dục đại học.
Độ tin cậy và tính hợp lệ
Vậy, bài kiểm tra có đáng tin cậy không? Hai khía cạnh quan trọng của một bài kiểm tra là tính hợp lệ và độ tin cậy. Độ tin cậy thể hiện liệu bài kiểm tra có sai số đo lường hay không, hay nói cách khác, “nếu bạn làm bài kiểm tra một lần nữa, bạn có nhận được kết quả giống nhau không?”. Tính hợp lệ cho biết liệu chúng ta có thực sự đo lường được trí thông minh hay không. Kết quả của bài kiểm tra có tương quan với thành tích học tập tốt không? Kết quả bài kiểm tra tốt hơn có nghĩa là có nhiều khả năng thành công trong sự nghiệp hơn không?
Về vấn đề này, các bài kiểm tra Raven có độ tin cậy khá tốt trong khoảng từ 80% đến 90%, vì vậy sai số đo lường là nhỏ. Về tính hợp lệ, một cách rất phổ biến để xác định xem một bài kiểm tra có hợp lệ hay không là so sánh kết quả của nó với một bài kiểm tra đã được công nhận hơn. So với thang Wechsler mạnh mẽ hơn, các mối tương quan thực sự khá tốt, khoảng 55% đến 70%. Nhưng không đủ tốt để sử dụng các bài kiểm tra cho bất kỳ mục đích nào, như chúng tôi đã nói trước đó.
Phiên bản rút gọn
Vì bài kiểm tra kéo dài 40 phút, có thể quá lâu trong một số trường hợp, các chuyên gia đã tạo ra một số phiên bản rút gọn, ngắn hơn và do đó nhanh hơn để thực hiện.
Một trong những phương pháp (Arthur và Day, 1994) là tạo ra một bài kiểm tra chỉ gồm 12 câu hỏi trong 12 phút (thay vì 36, tức là 33% so với bài kiểm tra gốc) bằng cách chọn chỉ những câu hỏi có sự khó khăn thực sự tăng lên.
Tuy nhiên, một số nhà tâm lý học đã chỉ trích phương pháp này, vì việc giải quyết các câu hỏi khó hơn thường dựa vào việc giải các mẫu dễ hơn từ những câu hỏi trước. Vì vậy, một phiên bản mới đã xuất hiện, trong đó người tham gia được cung cấp bộ câu hỏi gốc với thời gian giới hạn 20 phút và thang điểm khác.
Both options đã được phát hiện là có khả năng dự đoán IQ tốt - nhưng tất nhiên không bằng phiên bản gốc -
Điểm mạnh và điểm yếu
Với những điểm mạnh của nó, việc thực hiện rất dễ dàng và khá nhanh chóng. Điều này cho phép kiểm tra các nhóm lớn mà không cần nỗ lực tốn kém, đó là lý do nó được Raven tạo ra ngay từ đầu. Hơn nữa, vì bài kiểm tra có rất ít hướng dẫn và hoàn toàn không lời, nó cho phép so sánh mọi người mà không bị thiên lệch từ các nền tảng và trình độ giáo dục khác nhau.
Từ một góc nhìn tiêu cực, điểm yếu lớn nhất là nó chỉ tập trung vào trí thông minh linh hoạt, mà không đánh giá nhiều khả năng nhận thức khác. Đúng là khả năng suy luận và quy nạp mà không có kiến thức trước là khả năng dự đoán tốt nhất, nhưng nó không toàn diện. Điều này giải thích tại sao thang đo Wechsler lại vượt trội về tính hợp lệ và được sử dụng để dự đoán chính xác hơn, vì nó là một bài kiểm tra dài hơn và toàn diện hơn.
Một điểm yếu khác là mặc dù công bằng về văn hóa, sự khác biệt kết quả giữa các quốc gia đủ mạnh để cần tạo ra các thang đo địa phương để so sánh. Điều này khiến giả thuyết công bằng văn hóa bị xem xét một phần. Có vẻ như các yếu tố kinh tế xã hội liên quan đến sự phát triển nhận thức cao hơn, có thể thông qua dinh dưỡng tốt và sức khỏe tốt hơn. Cũng có một số khác biệt giữa công dân nông thôn và thành phố, đặc biệt ở những quốc gia có sự khác biệt lớn giữa cả hai, như ở châu Phi.
Tóm tắt
Như chúng ta đã thấy, bài kiểm tra IQ Raven là một công cụ mạnh mẽ trong bộ công cụ của bất kỳ người kiểm tra trí tuệ nào. Nó nhanh chóng, chi phí thấp và dễ thực hiện. Tuy nhiên, việc sử dụng nó chỉ giới hạn trong những trường hợp cần dự đoán gần đúng. Vì nó chỉ kiểm tra một yếu tố trí tuệ, trí tuệ linh hoạt, mặc dù có mối tương quan cao với trí tuệ, nhưng nó vẫn là một đánh giá khá hạn chế về khả năng của một người.