Raven Progressive Matrices เป็นหนึ่งในแบบทดสอบ IQ ที่ใช้กันอย่างแพร่หลายที่สุด เราจะสำรวจประเภทต่าง ๆ ที่มีอยู่สามประเภท ประวัติและการพัฒนา เราจะผ่านตัวอย่างคำถามบางส่วน และสุดท้ายคือข้อดีและข้อเสีย ในเวลาไม่ถึงสิบ นาที คุณจะมีความเข้าใจที่ดีเกี่ยวกับโปรไฟล์ของประเภทการทดสอบนี้
บทนำสู่การทดสอบเรเวน
แม้ว่าจะเข้าใจโดยทั่วไปว่าเป็นการทดสอบเดียว แต่ Raven Matrices เป็นการทดสอบที่แตกต่างกันสามแบบที่มีคำถามประเภทเดียวกัน การทดสอบแรกคือ Coloured Progressive Matrices (CPM) สำหรับเด็กอายุห้าถึงสิบเอ็ดปี การทดสอบที่สองคือ Standard Progressive Matrices (SPM) ตั้งแต่อายุสิบเอ็ดปีจนถึงวัยผู้ใหญ่ และการทดสอบที่สามคือ Advanced Progressive Matrices (APM) ซึ่ง -ตามชื่อที่บอก- มีแมทริกซ์ที่ซับซ้อนและก้าวหน้ามากขึ้นและออกแบบมาสำหรับบุคคลที่มีความฉลาดสูงโดยสมมุติฐาน
ทุกการทดสอบประกอบด้วยชุดคำถาม ในแต่ละคำถาม คุณจะพบกับเมทริกซ์ที่มีองค์ประกอบตามรูปแบบหนึ่งหรือหลายรูปแบบ หนึ่งในส่วนของเมทริกซ์หายไปและต้องเติมเต็มโดยการเลือกจากทางเลือกที่นำเสนอ - ซึ่งมีเพียงหนึ่งทางเลือกที่เหมาะสมที่สุด -
ตัวอย่างเช่น APM มีคำถามในรูปแบบแมทริกซ์ 36 ข้อ และแต่ละข้อมีทางเลือก 8 ตัวเลือก โดยทั่วไปจะมีเวลาจำกัด 40 นาที แต่ก็มีเวอร์ชันที่ไม่มีเวลาจำกัดด้วย เวอร์ชันแรกจะวัดความสามารถในช่วงกว้าง (ไม่มีเวลาจำกัด) ขณะที่เวอร์ชันหลังจะเน้นที่ประสิทธิภาพและความสามารถทางปัญญา (มีเวลาจำกัด)
ด้วยคำถามใหม่แต่ละข้อ ความยากจะเพิ่มขึ้น ต้องการ “การใช้เหตุผลที่ซับซ้อนมากขึ้น” จนกว่าคนจะถึงจุดที่ว่าเมทริกซ์ใหม่ใดๆ ก็ยากเกินไปที่จะไขปริศนา
แม้ว่า CPM จะเป็นเวอร์ชันที่มีสีสันสำหรับเด็ก แต่ในความเป็นจริง สีไม่มีความสำคัญเลย เนื่องจากไม่ช่วยในการแก้ปัญหา และจุดประสงค์เดียวในการใช้สีคือเพื่อรักษาความกระตือรือร้นในขณะทำงาน ทดสอบที่ใช้สีเหล่านี้ ยังใช้กับผู้สูงอายุและผู้ที่มีความบกพร่อง ด้วย
การเกิดของการทดสอบ IQ ของ Matrices
ในปี 1938 นักจิตวิทยา J. Raven ได้สร้างเวอร์ชันแรกของการทดสอบ ซึ่งเป็นเวอร์ชันมาตรฐาน ในฐานะนักจิตวิทยาหนุ่ม เขาช่วยอาจารย์ของเขา ศ. Penrose ในการค้นหายีนที่เกี่ยวข้องกับความฉลาด ความซับซ้อนของการทดสอบที่มีอยู่ในขณะนั้นทำให้การวิจัยดำเนินไปได้ยาก และกระตุ้นให้มีการคิดค้นการทดสอบใหม่โดย Raven เพื่อประเมินความฉลาดได้อย่างรวดเร็ว ง่ายดาย และคุ้มค่า
เวอร์ชันสำหรับเด็ก (CPM) และเวอร์ชันสำหรับบุคคลที่มีความฉลาดสูง (APM) ถูกพัฒนาขึ้นในภายหลัง โดยมีการเผยแพร่ในปี 1947 ในปีนี้ยังมีการลดจำนวนคำถามจาก 48 เป็น 36 คำถาม เนื่องจากพบว่าหลายคำถามไม่ช่วยในการแยกแยะค่า IQ ในภายหลังมีการปรับปรุงหลายครั้งที่เพิ่มความถูกต้องและเผยแพร่คำถามใหม่ ๆ
ในมุมมองของ Raven การทดสอบมีจุดมุ่งหมายเพื่อวัด “ความสามารถในการเปรียบเทียบ การใช้เหตุผลโดยอนุโลม และพัฒนาวิธีการคิดอย่างมีเหตุผล โดยไม่คำนึงถึงข้อมูลที่ได้รับมาก่อน” ดังที่เราได้เห็นจากผู้สร้างการทดสอบคนอื่น ๆ เช่น Cattell Raven ก็พยายามสร้างการทดสอบที่ปราศจากอิทธิพลทางการศึกษาและวัฒนธรรมเช่นกัน
อย่างไรก็ตาม เราอาจถูกล่อลวงให้ตีความอดีตใหม่ด้วยความรู้ในปัจจุบันของเรา เพราะในความเป็นจริงเขาไม่เคยคิดว่าการทดสอบวัดความฉลาดทั่วไป แต่ละปัญหาทดสอบระบบความคิดเฉพาะเจาะจง
ในการนิยามของเขา สติปัญญาคือความสามารถในการดำเนินการในสถานการณ์ใด ๆ โดยมี (i) การเรียกคืนข้อมูลที่จำเป็นและ (ii) การเปรียบเทียบและการใช้เหตุผลโดยอนาล็อก ดังนั้นเราจึงสามารถกล่าวได้ว่า Raven มองว่าสติปัญญาประกอบด้วยสองส่วน และนั่นคือเหตุผลที่เขาวัดสติปัญญาโดยใช้การทดสอบ Mill Hill Vocabulary นอกเหนือจากแมทริกซ์ จะเป็นภายหลังที่ความสัมพันธ์สูงระหว่างผลสติปัญญารวมและการทดสอบแมทริกซ์จะสนับสนุนการใช้เพียงหนึ่งในการทดสอบเหล่านี้เป็นการคาดการณ์ที่เพียงพอ
คำถามในรูปแบบเมทริกซ์
แต่ละคำถามจะเป็นรูปสี่เหลี่ยม 3x3 ที่มีเก้าช่อง (บางครั้งเป็น 2x2 สำหรับเวอร์ชันที่ง่ายกว่า) ในแต่ละช่องจะมีรายการหนึ่งหรือมากกว่า (เช่น วงกลม, สามเหลี่ยม, ลูกศร,...) และช่องด้านล่างขวาจะว่าง เพื่อเติมช่องว่าง ผู้เข้าร่วมต้องเลือกจากคำตอบที่เป็นไปได้แปดข้อ
จากความสัมพันธ์ระหว่างรายการต่างๆ ภายในแต่ละเซลล์และกับรายการของเซลล์อื่นๆ บุคคลต้องสรุปหรืออนุมานว่ามีกฎและความสัมพันธ์ใดบ้าง และดังนั้นคำตอบใดที่เหมาะสมที่สุดในการเติมเต็มตาราง คำตอบที่ถูกต้องจะต้องชัดเจน เนื่องจากจะมีเพียงความสัมพันธ์ที่ไม่คลุมเครือ (หรือกลุ่มความสัมพันธ์) ที่นำไปสู่คำตอบที่เป็นไปได้เพียงหนึ่งเดียวเท่านั้น
มาดูตัวอย่างพื้นฐานสองตัวอย่างก่อนที่เราจะดำดิ่งสู่ประเภทการคิดที่พบบ่อยที่สุด ตอนนี้มาดูแมทริกซ์แรกกัน:
ตามที่เราเห็น แต่ละแถวมีประเภทขององค์ประกอบเดียวกัน แถวแรกเป็นวงกลมทั้งหมด แถวที่สองเป็นรูปสามเหลี่ยมทั้งหมด และแถวสุดท้ายมีสี่เหลี่ยมผืนผ้าสองอัน ตัวเลือกการตอบกลับที่ให้เลือกมีดังนี้
จำเป็นต้องใช้เหตุผล: ดังนั้นเซลล์ว่างสุดท้ายจึงต้องเป็นประเภทเดียวกับอีกสองเซลล์ในแถว ซึ่งเป็นสี่เหลี่ยมผืนผ้าว่างที่ไม่มีสีใด ๆ นั่นทำให้ A เป็นตัวเลือกเดียวที่เป็นไปได้ การเลือก B จะเป็นความผิดพลาดเนื่องจากไม่มีรูปอื่นที่มีสีเต็ม ด้านล่างคุณสามารถดูว่าตารางเต็มจะเป็นอย่างไรด้วยคำตอบที่ถูกต้อง ตารางเต็มจะเป็น:
ตอนนี้เรามาดูตัวอย่างที่สอง ซึ่งซับซ้อนกว่านิดหน่อย
ครั้งนี้เราสามารถเห็นได้ว่าแต่ละแถวมีประเภทขององค์ประกอบเดียวกัน แต่ในทุกคอลัมน์ที่อยู่ทางขวามากขึ้น รูปภาพจะมีสีสันมากขึ้นภายใน
ทางเลือกที่เราต้องเลือกมีดังต่อไปนี้:
จำเป็นต้องใช้การคิด: ดังนั้นตารางดูเหมือนจะรวมกฎสองข้อ หนึ่งคือการรักษาประเภทของรูปทรงเดียวกันในแต่ละแถว สองคือการทำให้ภายในของรูปทรงในแต่ละคอลัมน์มืดลงเรื่อยๆ ยิ่งไปทางขวามากขึ้น นั่นหมายความว่าเราควรเลือก B เนื่องจากมันเป็นสี่เหลี่ยมผืนผ้าเหมือนรูปทรงในแถว แต่ก็เข้มกว่าสองรูปอื่นที่ปรากฏในคอลัมน์ทางซ้ายซึ่งมีสีอ่อนกว่า มาดูคำตอบกัน:
ประเภทของการใช้เหตุผลที่ต้องการ
ตามที่เราได้กล่าวไปแล้ว ในระดับนามธรรม การทดสอบวัดความสามารถในการใช้เหตุผลทั้งแบบอนุมานและแบบอุปนัย ตัวอย่างที่เป็นรูปธรรมของเหตุผลที่จำเป็น ได้แก่:
- การแยกแยะความเหมือนและความแตกต่างในรูปภาพและเข้าใจว่ามันมีผลต่อแต่ละเซลล์อย่างไร
- การประเมินการจัดแนวในสนามการรับรู้ของรูปภาพในความสัมพันธ์กับพวกเขาและรูปภาพอื่น ๆ
- การรับรู้ว่ารูปทรงสามารถรวมกันเป็นทั้งหมดได้
- การวิเคราะห์ส่วนต่าง ๆ ของรูปภาพและแยกแยะว่าองค์ประกอบใดมีความสำคัญในแต่ละกรณี
- เปรียบเทียบการเปลี่ยนแปลงแบบอนาล็อกในแต่ละส่วนของเมทริกซ์
เราไม่สามารถเปิดเผยรูปแบบและกฎเฉพาะมากเกินไปที่การทดสอบใช้ได้โดยไม่ทำให้ความสมบูรณ์ของมันเสียหาย แต่เราสามารถกล่าวถึงกฎพื้นฐานบางอย่างที่มักปรากฏในปัญหาเป็นตัวอย่างได้อย่างสมบูรณ์:
- ความสอดคล้อง: เป็นลักษณะของคำถามเด็กที่เรื่องราวจะมีความหมายได้ก็ต่อเมื่อมีองค์ประกอบหนึ่งเท่านั้น
- ส่วนประกอบที่เหมือนกัน: เมื่อส่วนประกอบควรคงที่เหมือนในตัวอย่างที่เราเห็นข้างต้น
- รูปแบบต่อเนื่อง: บุคคลต้องค้นหาว่ารูปแบบที่ตามมาคืออะไรในแต่ละคอลัมน์หรือแถว (เช่น รูปภาพหมุนไปทางขวาในแต่ละคอลัมน์ เป็นต้น)
- การใช้การดำเนินการทางคณิตศาสตร์: เช่น เมื่อแต่ละคอลัมน์มีจำนวนองค์ประกอบเป็นสองเท่า
- ความสัมพันธ์และการรวมกัน: เช่นเมื่อองค์ประกอบจากเซลล์ที่แตกต่างกันรวมกันเพื่อสร้างรายการที่ซับซ้อนมากขึ้น
บ่อยครั้งที่คำตอบที่ให้กับปัญหานั้นถูกต้อง แต่เหตุผลกลับมีข้อบกพร่อง อาจจะคำตอบถูกต้อง แต่มีโอกาสสูงที่คำถามถัดไปจะไม่ถูกต้อง ดังนั้น ตอนนี้เมื่อพูดถึงข้อผิดพลาด ข้อผิดพลาดที่พบบ่อยที่สุดเมื่อทำการทดสอบคืออะไร? ข้อผิดพลาดทั่วไปสองประการคือ:
- ความสัมพันธ์ที่ไม่สมบูรณ์: เมื่อบุคคลไม่สามารถเปิดเผยกฎและรูปแบบทั้งหมดที่มีอยู่ในเมทริกซ์ได้ มักพบในคำถามที่ซับซ้อน
- การรวมกันของแนวคิด: เมื่อรายละเอียดที่ไม่เกี่ยวข้องควรถูกมองข้ามแต่กลับไม่เป็นเช่นนั้น เช่น การใช้รูปแบบขนาดเมื่อควรจะถูกละเลยเพราะมีเพียงสององค์ประกอบที่ได้รับผลกระทบ
ควรใช้เมื่อไหร่?
การทดสอบของ Raven ถูกใช้ในสภาพแวดล้อมทางการศึกษา การทดลอง และคลินิก อย่างไรก็ตาม การใช้งานควรจำกัดเฉพาะการตัดสินใจหรือบริบทที่ไม่ต้องการความแม่นยำสูง และต้องการการทดสอบที่ง่ายและคุ้มค่า ตัวอย่างเช่น การทดสอบนี้ค่อนข้างแพร่หลายในงานวิจัยจิตวิทยาเมื่อ IQ ที่แน่นอนไม่ใช่เป้าหมายหลักของการศึกษา แต่ไม่ถูกใช้ในการประเมินทางคลินิกที่ยาวนานซึ่งการตัดสินใจที่สำคัญอาจส่งผลต่อชีวิตของบุคคล.
ขึ้นอยู่กับอายุ คุณควรใช้เวอร์ชันเด็ก (CPM) หรือเวอร์ชันผู้ใหญ่ (SPM หรือ APM) โดยทั่วไปแล้วจะใช้ในบริบทของการศึกษาเพื่อให้การคาดการณ์พื้นฐานเกี่ยวกับระดับสติปัญญาของเด็ก เวอร์ชัน Advanced Matrices (APM) ก็เป็นที่นิยมใช้ในระดับการศึกษาสูงเช่นกัน
ความถูกต้องและความเชื่อถือได้
ดังนั้น การทดสอบนี้มีความแข็งแกร่งหรือไม่? สองแง่มุมที่สำคัญของการทดสอบคือความถูกต้องและความเชื่อถือได้ ความเชื่อถือได้หมายถึงการมีข้อผิดพลาดในการวัด หรือพูดอีกอย่างคือ “ถ้าคุณทำการทดสอบอีกครั้ง คุณจะได้ผลลัพธ์เหมือนเดิมหรือไม่?” และความถูกต้องบอกเราว่าเรากำลังวัดความฉลาดจริงๆ หรือไม่ ผลลัพธ์ของการทดสอบสัมพันธ์กับผลการเรียนที่ดีหรือไม่? ผลการทดสอบที่ดีกว่าหมายถึงโอกาสในการมีอาชีพที่ประสบความสำเร็จมากขึ้นหรือไม่?
ในเรื่องนี้ การทดสอบ Raven มี ความเชื่อถือได้ที่ค่อนข้างดี ซึ่งอยู่ในช่วงระหว่าง 80% ถึง 90% ดังนั้นข้อผิดพลาดในการวัดจึงน้อย สำหรับความถูกต้อง วิธีที่พบบ่อยในการตรวจสอบว่าการทดสอบมีความถูกต้องหรือไม่คือการเปรียบเทียบผลลัพธ์กับการทดสอบที่มีชื่อเสียงกว่า เปรียบเทียบกับ มาตราส่วน Wechsler ความสัมพันธ์ค่อนข้างดีจริง ๆ ประมาณ 55% ถึง 70% แต่ยังไม่ดีพอที่จะใช้การทดสอบเพื่อวัตถุประสงค์ใด ๆ ตามที่เราได้กล่าวไว้ก่อนหน้านี้
เวอร์ชันย่อ
เนื่องจากการทดสอบใช้เวลา 40 นาที ซึ่งอาจนานเกินไปในบางสถานการณ์ ผู้เชี่ยวชาญจึงได้สร้างเวอร์ชันย่อหลายเวอร์ชัน ซึ่งใช้เวลาน้อยกว่าและทำได้เร็วขึ้น
หนึ่งในวิธีการ (Arthur และ Day, 1994) คือการสร้างแบบทดสอบที่ประกอบด้วยคำถามเพียง 12 ข้อในเวลา 12 นาที (แทนที่จะเป็น 36 ข้อ ซึ่งเป็น 33% ของแบบทดสอบเดิม) โดยเลือกเฉพาะคำถามที่มีความยากเพิ่มขึ้นจริง ๆ เท่านั้น
อย่างไรก็ตาม นักจิตวิทยาบางคนได้วิจารณ์วิธีการนี้ เนื่องจากการแก้ปัญหาที่ยากขึ้นมักขึ้นอยู่กับการแก้รูปแบบที่ง่ายกว่าจากคำถามก่อนหน้า ดังนั้นจึงมีเวอร์ชันใหม่ที่ผู้เข้าร่วมจะได้รับชุดคำถามเดิมพร้อมเวลาจำกัด 20 นาทีและมาตราส่วนการให้คะแนนที่แตกต่างกัน
Both options ถูกพบว่าทำงานได้ดีในการคาดการณ์ IQ -แต่แน่นอนว่าไม่ดีเท่ากับเวอร์ชันดั้งเดิม-
จุดแข็งและจุดอ่อน
สำหรับจุดแข็งของมัน มันง่ายมากที่จะดำเนินการและใช้เวลาไม่นาน นี่ทำให้สามารถทดสอบกลุ่มใหญ่ได้โดยไม่ต้องใช้ความพยายามมากมายและค่าใช้จ่ายสูง ซึ่งเป็นเหตุผลที่มันถูกสร้างขึ้นโดย Raven ในตอนแรก นอกจากนี้ เนื่องจากการทดสอบมีคำแนะนำเพียงเล็กน้อยและไม่มีการใช้คำพูด มันจึงช่วยให้เปรียบเทียบผู้คนได้โดยไม่มีอคติจากพื้นฐานและระดับการศึกษาที่แตกต่างกัน
ในมุมมองเชิงลบ จุดอ่อนที่ใหญ่ที่สุดคือมันมุ่งเน้นไปที่ความฉลาดเชิงไหล โดยไม่ประเมินความสามารถทางปัญญาอื่นๆ อีกมากมาย เป็นความจริงที่การให้เหตุผลและการอนุมานโดยไม่มีความรู้ก่อนหน้านั้นเป็นความสามารถที่คาดการณ์ได้มากที่สุด แต่ก็ไม่ครอบคลุม นั่นอธิบายได้ว่าทำไม มาตราส่วนเวคส์เลอร์ จึงมีความถูกต้องสูงกว่าและถูกใช้ในการคาดการณ์ที่แม่นยำกว่า เนื่องจากเป็นชุดทดสอบที่ยาวและครอบคลุมมากกว่า
อีกจุดอ่อนหนึ่งคือ แม้ว่าจะเป็นการทดสอบที่ไม่ขึ้นกับวัฒนธรรม แต่ความแตกต่างของผลลัพธ์ระหว่างประเทศนั้นมีความแข็งแกร่งพอที่จะต้องสร้างมาตราส่วนท้องถิ่นเพื่อเปรียบเทียบ ดังนั้นจึงทำให้สมมติฐานที่ไม่ขึ้นกับวัฒนธรรมต้องถูกตรวจสอบบางส่วน ดูเหมือนว่าปัจจัยทางเศรษฐกิจและสังคมมีความสัมพันธ์กับการพัฒนาทางปัญญาที่สูงขึ้น อาจจะผ่านการมีโภชนาการที่ดีและสุขภาพที่ดีกว่า และยังมีความแตกต่างระหว่างประชาชนในชนบทและเมือง โดยเฉพาะในประเทศที่มีความแตกต่างอย่างมากระหว่างทั้งสอง เช่น ในแอฟริกา
สรุป
ตามที่เราได้เห็น การทดสอบ IQ ของ Raven เป็นเครื่องมือที่ทรงพลังในกล่องเครื่องมือของผู้ทดสอบความฉลาด มันมีความรวดเร็วในการให้ผล ค่าใช้จ่ายต่ำ และง่ายต่อการดำเนินการ อย่างไรก็ตาม การใช้งานของมันถูกจำกัดเฉพาะกรณีที่ต้องการการคาดการณ์ที่ประมาณเท่านั้น เนื่องจากมันทดสอบเพียงปัจจัยด้านความฉลาดเดียวคือ ความฉลาดเชิงไหล แม้ว่าจะมีความสัมพันธ์สูงกับความฉลาด แต่มันยังคงเป็นการประเมินความสามารถของบุคคลที่ค่อนข้างจำกัด
.png)




.png)
.png)






.png)


