میانگین IQ چقدر است؟ جواب ساده و حقیقتِ به‌هم‌ریخته

میانگین IQ عدد ۱۰۰ است. این پاسخ رسمیِ کتاب‌های درسیه و همون چیزیه که بیشتر وب‌سایت‌ها توی اولین جمله بهت می‌گن.

‍

این هم نوع پاسخی است که آدم‌های باهوش را مشکوک می‌کند، چون انگار خیلی تمیز و مرتب به نظر می‌رسد. و راستش، شکِ تو سالمه.

‍

ترفندش اینه: IQ مثل قدِ متوسط نیست که کلی آدم رو اندازه بگیری و بعد یه عدد دربیاری. تست‌های مدرن IQ طوری نرمال‌سازی/استاندارد می‌شن که میانگین نمره در جمعیتِ مبنا برابر 100 باشه. یعنی 100 یه حقیقت مرموزِ حک‌شده روی کوه نیست؛ یه نقطهٔ مرجعیه که طراحان آزمون ساخته‌اند تا تفسیر نمره‌ها راحت باشه.

‍

این که IQ واقعی نیست یا به درد نمی‌خورد. یعنی باید سؤال بهتری بپرسیم. نه «میانگین IQ چقدر است؟» بلکه «میانگینِ برای چه کسانی، در کدام تست، با هنجاردهی در چه زمانی، و در مقایسه با کدام گروه؟» وقتی این را بپرسی، موضوع خیلی جذاب‌تر می‌شود.

‍

100 چون میانگینه که آزمون رو همین‌جوری طراحی کردن

آزمون‌های اولیه‌ی هوش (IQ) دقیقاً مثل آزمون‌های مدرن کار نمی‌کردند. کار اولیه‌ی آلفرد بینِه در فرانسه—که در مقاله‌ی ما درباره‌ی تاریخچه‌ی هوش و تست‌های IQ کامل و عمیق توضیح داده شده—هدفش این بود که کودکانی را شناسایی کند که شاید به حمایت آموزشی بیشتری نیاز داشته باشند. بعدتر، سیستم قدیمی‌ای که ویلهلم اشتِرن و لوئیس ترمن محبوبش کردند، از یک فرمول سن ذهنی استفاده می‌کرد: سن ذهنی تقسیم بر سن تقویمی، بعد ضربدر 100. این روش برای کودکان نسبتاً خوب جواب می‌داد، اما برای بزرگسالان سریعاً دردسرساز شد؛ چون «سن ذهنی» دقیقاً چیزی نیست که بخواید موقع شام خانوادگی حسابش کنید.

‍

تست‌های جدید IQ از چیزی استفاده می‌کنند که روان‌شناسان به آن IQ انحرافی می‌گویند. به‌جای اینکه بپرسند آیا یک کودک ۱۰ ساله مثل یک کودک ۱۲ ساله فکر می‌کند یا نه، تست‌های امروز عملکرد تو را با نتیجه‌ی یک نمونه‌ی بزرگ و استاندارد از افراد هم‌سنِ خودت مقایسه می‌کنند. بعد هم نمره‌های خام طوری تبدیل می‌شوند که توزیع، میانگین ۱۰۰ داشته باشد و معمولاً انحراف معیار ۱۵ است.

‍

همان‌طور که مرجع پزشکیِ «Standard of Care» توضیح می‌دهد، نمره‌های جدید IQ به یک توزیع نرمال تبدیل می‌شوند با میانگین ۱۰۰ و انحراف معیار ۱۵. Psych Central هم در یک مرور کلیِ ۲۰۲۲ همین نکته را گفته: میانگین و میانه هر دو روی ۱۰۰ تنظیم شده‌اند. پس بله، اگر کسی جوابِ رایج و استاندارد بخواهد، همان ۱۰۰ است.

‍

چرا ۱۰۰؟ بیشتر به این خاطر که راحت است. یک نقطه‌ میانیِ ساده‌ست و آدم‌ها شهودی می‌فهمن عددهای بالاتر از اون یعنی بالاتر از میانگین و عددهای پایین‌تر یعنی پایین‌تر از میانگین. طراح‌های آزمون اگر حال‌وهوای نمایشی داشتند می‌تونستن ۵۰۰ رو انتخاب کنن، ولی خوشبختانه این کار رو نکردن.

‍

به همین دلیل هم جمله‌ی «میانگین IQ بین ۸۵ تا ۱۱۵ است» کمی دقیق نیست. از نظر فنی، عدد ۱۰۰ میانگین است. بازه‌ی ۸۵ تا ۱۱۵، میانگینِ بازه نام دارد؛ یعنی محدوده‌ای که بخش بزرگی از افراد داخل آن قرار می‌گیرند.

‍

نمره‌ات دقیقاً یعنی چی؟ به زبان ساده

وقتی می‌دونی نمره‌های IQ حولِ ۱۰۰ می‌چرخن، قدم بعدیِ مفید «پراکندگی»ه. بیشتر آزمون‌های معتبر IQ، انحراف معیارِ ۱۵ امتیاز دارن. اینطوری یه نقشه‌ی خیلی کاربردی از منحنی زنگی به دست میاری.

‍

حدود ۶۸٪ از افراد نمره‌ای بین ۸۵ تا ۱۱۵ می‌گیرند. حدود ۹۵٪ بین ۷۰ تا ۱۳۰ نمره می‌آورند. فقط نزدیک به ۲٪ نمره بالاتر از ۱۳۰ دارند و درصدی کوچک و مشابه هم زیر ۷۰ قرار می‌گیرد. به همین دلیل ۱۳۰ اغلب به‌عنوان یک معیار تقریبی برای عملکرد «بسیار برجسته» استفاده می‌شود، در حالی‌که نمره‌های زیر ۷۰ می‌توانند بخشی از ارزیابی برای ناتوانی ذهنی (intellectual disability) باشند. اما متخصصان نه از روی IQ به‌تنهایی ناتوانی ذهنی را تشخیص می‌دهند؛ عملکرد تطبیقی—این‌که فرد چقدر خوب از پس زندگی روزمره برمی‌آید—هم اهمیت دارد.

‍

در اینجا هم صدک‌ها کمک می‌کنند. یک IQ برابر 100 تقریباً در رتبه‌ی صدکیِ 50 قرار می‌گیرد. IQ برابر 115 حدوداً صدک 84 است. IQ برابر 130 هم نزدیکِ صدک 98 قرار دارد. پس وقتی کسی می‌گوید IQ او 130 است، منظورش این نیست که 130 سؤال را از بین 100 تا درست زده—چیزی که نقض بسیار چشمگیرِ حساب‌وکتاب می‌شود. منظورش این است که او نمره‌ای بالاتر از حدود 98٪ از گروهِ هنجار گرفته است.

‍

و وقتی درصدک‌ها را کامل درک کنی، «منحنی زنگی» معروف دیگه شبیه آمارهای انتزاعیِ دیواری به نظر نمیاد و بیشتر شبیه یک نقشه می‌شه. این می‌رسه به سؤال بعدی: واقعاً داده‌های واقعی هم همین‌طور رفتار می‌کنن؟

‍

نمودار زنگوله‌ای (bell curve) یک افسانه نیست

احتمالاً شکل کلاسیکِ «منحنی زنگی» را دیده‌ای که این روزها آنلاین دست‌به‌دست می‌شود، معمولاً کنارِ یک نظرِ خیلی بد. هرچقدر هم این موضوع آزاردهنده باشد، اصلِ شکلِ پایه واقعیت دارد.

‍

آزمون‌های IQ طوری طراحی شده‌اند که توزیع تقریباً نرمالی بدهند و در عمل هم معمولاً همین‌طور است. ریچارد وارنِه در بررسی ادبیات پیچیده‌ی برآوردهای «میانگین IQ» در سطح کشورها در سال ۲۰۲۳ استدلال کرد که داده‌های IQ عموماً از نظر آماری آن‌قدر رفتار قابل‌قبولی دارند که محاسبه‌ی میانگین، فرض‌های رایج را نقض نمی‌کند. این حرف شاید خشک به نظر برسد، اما مهم است: واقعاً می‌توان درباره‌ی نمره‌های میانگین منطقی صحبت کرد.

‍

حتی در گروه‌هایی که مردم برایشان کلیشه می‌سازند، این الگو را می‌بینی. در یک پژوهش روی کودکانی با ADHD، مشکلات خواندن، یا هر دو، روان‌شناس «بونی کاپلان» و همکارانش دیدند که توزیع تخمینی IQ در همه‌ی سه گروه از نظر آماری با توزیع نرمال تفاوت معنی‌داری ندارد و بیش از نیمی از کودکان در بازه‌ی میانگین قرار می‌گیرند. نتیجه‌شان هم خیلی بی‌پرده و البته تازه بود: کودکان مبتلا به ADHD به همان اندازه‌ی دیگر کودکان احتمال IQ بالاتر از میانگین ندارند.

‍

این مطالعه را دوست دارم چون هر دو افسانه را با هم می‌ترکاند. اول، منحنی زنگی دقیقاً همان‌جایی ظاهر می‌شود که انتظارش را داریم. دوم، برچسب‌های بالینی به‌طور جادویی هوشِ افراد را برایت روشن نمی‌کنند. آدم‌های واقعی هم کله‌شقی می‌کنند و حاضر نیستند خودشان را با کلیشه‌های اینترنتی جور کنند (راستش، حق هم داری!).

‍

حالا بخش شلوغش: گروه‌های واقعی همیشه میانگینِ ۱۰۰ ندارن

اگر تست‌های IQ را روی میانگین ۱۰۰ استاندارد کرده‌اند، چرا گاهی می‌بینی که میانگین آمریکا حدود ۹۷ است یا اینکه «میانگین جهانی IQ» نزدیک ۸۹ گفته می‌شود؟ آیا پاسخ رسمی اشتباه است؟

‍

نه. اما اینجاست که عبارت میانگین هوش (IQ) معنی‌اش عوض می‌شود.

‍

وقتی نویسنده‌ها درباره میانگین IQ یک کشور حرف می‌زنند، معمولاً داده‌های نمونه‌های مختلف، سال‌های متفاوت، آزمون‌های گوناگون و گاهی روش‌هایی کاملاً بحث‌برانگیز را با هم قاطی می‌کنند. این با نمره استاندارد ۱۰۰ که داخل خودِ آزمون طراحی شده، یکی نیست.

‍

برای مثال، Psych Central به برآوردی اشاره کرد که میانگین IQ آمریکا در سال ۲۰۱۹ برابر ۹۷.۴۳ بوده. این عدد غیرممکن نیست، اما ویژگی همیشگیِ مردم آمریکاست که مثل گزارش هوا معلق در آسمان باشد. همه‌چیز به این بستگی دارد که چطور این برآورد ساخته شده است.

‍

مرور سال ۲۰۲۳ِ وارن اینجا خیلی به کارت می‌آید، چون او حاضر نمی‌شود به هیچ‌یک از دو گروهِ افراطیِ طرف مقابل بپیوندد که از دو تپه‌ی مخالف با فریاد نتیجه می‌خواهند. او نمی‌گوید دیتاست‌های ملیِ IQ کامل‌اند. همچنین نمی‌گوید هیچ ارزشی ندارند. وارن استدلال می‌کند که بعضی از این برآوردها «چیزی مهم را» نشان می‌دهند، اما در عین حال به مشکلات جدیِ کیفیت اشاره می‌کند؛ مخصوصاً در کشورهایی که داده‌ها کم‌پشت یا قدیمی‌اند.

‍

یکی از نکته‌های قابل‌توجهش این است که برآوردهای کشورها از چند نمونه مختلف معمولاً فقط حدود ۵.۸ امتیاز در میانگین با هم فرق دارند؛ هرچند بعضی کشورها بیش از ۲۰ امتیاز اختلاف نشان می‌دهند چون یک نمونه قدیمی یا باکیفیت پایین، تصویر را کج می‌کند. او همچنین نشان داد که بسته به فرض‌ها، میانگین جهانیِ محاسبه‌شده از یک دیتاست بحث‌برانگیز می‌تواند حدود ۸۶.۷ تا ۸۸.۳ دربیاید. همین الان احتمالاً سرت داغ شده. یعنی IQ «واقعی» بشر اصلاً ۱۰۰ نیست؟ نه، این‌قدر سریع نتیجه نگیر.

‍

همان‌طور که وارن تأکید می‌کند، IQ یک معیار است، نه خودِ هوش. و میانگین‌های گروهی نمی‌توانند بهت بگویند تفاوت‌ها از آموزش می‌آید یا تغذیه، سلامت، آشنایی با آزمون، زبان، سوگیری نمونه‌گیری یا چیز دیگری. آن‌ها در هر صورت توان ذاتیِ هیچ‌کس را مشخص نمی‌کنند. این نکته را مخصوصاً مهم می‌دانم، چون بحث‌های عمومی درباره IQ خیلی وقت‌ها از یک عددِ لرزان سریع می‌پرند به یک نظریه بزرگ درباره تمدن، آن هم در حدود دوازده ثانیه. این علم نیست؛ فقط قهوه‌ای‌ست با اتصال وای‌فای.

‍

میانگین نسبت به کی؟ اثر فلین همه‌چیز را تغییر می‌دهد

یک دلیل دیگر هم هست که میانگین IQ سر می‌خورد: گروهِ مقایسه در طول زمان عوض می‌شود.

‍

در بخش زیادی از قرن بیستم، نمره‌های خام آزمون‌های IQ در بسیاری از کشورها بالاتر رفت. این الگو به اثر فلین معروف است؛ به نام پژوهشگر، جیمز فلین. خلاصه‌ی «استاندارد مراقبت» برآورد کلاسیکِ حدود ۳ امتیاز IQ در هر دهه را ذکر می‌کند، و ادبیات گسترده‌تر پژوهشی که در این پرونده بررسی شده، این اثر را حدود ۲.۹۳ امتیاز در هر دهه نشان می‌دهد (بر اساس یک متاآنالیز در سال ۲۰۱۴ توسط تراهان و همکاران). یک متاآنالیز بعدی هم در سال ۲۰۱۵ توسط پیتشنگیگ و ووراکک نیز افزایش‌های گسترده‌ای پیدا کرد، هرچند برای همه‌ی انواع هوش یکسان نبود.

‍

یعنی اگر یک تست قدیمی IQ را با معیارهای قدیمی به یک آدم امروزی بدهید، ممکن است امتیازش به‌طور محسوسی بالاتر از ۱۰۰ باشد. نه چون مغز انسان‌ها یک‌دفعه وارد «حالت توربو» شده، بلکه چون محیط‌ها عوض شده: آموزش بهتر، تغذیه، مراقبت‌های بهداشتی و آشنایی بیشتر با حل مسائل انتزاعی احتمالاً نقش داشته‌اند.

‍

دقیقاً به همین خاطر است که تست‌های IQ باید دوباره استاندارد شوند. اگر این کار انجام نشود، «میانگین» آرام‌آرام بالا می‌رود و دیگر معنی میانگین را نمی‌دهد. به بیان ساده، عدد ۱۰۰ ثابت می‌ماند چون تست‌ها به‌روزرسانی می‌شوند؛ مثل اینکه خط‌کش دوباره کالیبره می‌شود.

‍

جالب اینجاست که در بعضی کشورها، الان حتی می‌بینی اثر فلین در حال کند شدن یا گاهی برگشت است. پس این افزایش طولانیِ نمره‌ها هم قانون طبیعت نیست. پژوهش‌های هوش هم یک عادت بد دارند: هرکس زیادی مغرور شود را مجازات می‌کنند (که البته به انصاف، خدمت مفیدی است).

‍

میانگین IQ چه چیزهایی را به ما نشان می‌دهد—و دقیقاً چه چیزهایی را هرگز نمی‌تواند

خیلی زیاد است، اگر با انضباط پیش بروید. و به هیچ‌وجه به همان اندازه‌ای نیست که آدم‌ها آرزو دارند، اگر این کار را نکنید.

‍

در سطح فردی، آزمون‌های IQ واقعاً می‌تونن مفید باشن. مثلاً یک روانشناس مدرسه‌ای ممکنه ازشون استفاده کنه تا بفهمه چرا یک کودک روان می‌خونه ولی با حافظه کاری خیلی مشکل داره، یا چرا یکی دیگه به یک مسیر تحصیلی پیشرفته‌تر نیاز داره. در کلینیک‌ها هم نمره‌های IQ می‌تونن بخشی از ارزیابی شرایط رشدی یا افت شناختی باشند. این ارزش واقعی دنیاست، نه فقط تزئینات روان‌سنجی.

‍

در سطح گروهی، میانگین‌ها می‌تونن الگوها رو نشان بدن. ولی توصیف، توضیح نیست. قبلاً گفتیم که میانگینِ یک گروه بهت نمی‌گه چرا اون میانگین دقیقاً همونه که هست. این تفاوت خیلی مهمه.

‍

مثلاً، تحقیقاتی که در این پرونده خلاصه شده نشان می‌دهند محیط می‌تواند نتایج آی‌کیو را به‌شدت شکل بدهد. در یک مطالعه معروف در سال ۲۰۰۳، «اریک تورکهایمر» و همکارانش دریافتند که در خانواده‌های کم‌درآمد، محیط مشترک بخش خیلی بیشتری از تفاوت‌های آی‌کیوی کودکان را توضیح می‌دهد تا ژن‌ها— موضوعی که در مقاله‌مان درباره این‌که آیا هوش ارثی است یا نه بررسی می‌کنیم. اما در خانواده‌های مرفه، تفاوت‌های ژنتیکی سهم بیشتری در تغییرات داشتند. این هم یکی از همان یافته‌هایی است که باید همه، با هر گرایش فکری، یک دقیقه بنشینند و فکر کنند.

‍

زمینه‌ی اجتماعی هم مهم است. کلود استیل و جاشوا آرونسون معروفاً نشان دادند که «تهدید کلیشه‌ای» می‌تواند وقتی افراد از تأیید شدنِ یک کلیشه‌ی منفی درباره‌ی گروهشان می‌ترسند، عملکرد در آزمون را پایین بیاورد. پس حتی قبل از اینکه به ادعاهای بزرگ درباره‌ی نژاد، کشور یا «هوش تمدنی» برسیم (که همین هم نشانه‌ی بدی است)، باید یک چیز ساده را بپذیریم: عملکرد آزمون در خلأ تولید نمی‌شود.

‍

به همین خاطر وقتی IQ رو مثل سرنوشت باهاش برخورد می‌کنن، حالم بد می‌شه. علم اینو تأیید نمی‌کنه. IQ چیز واقعی و مهمی رو اندازه می‌گیره، اما ارزش تو، خلاقیتت، مهربونی‌ات، قضاوتت یا آینده‌ات رو—به هیچ شکلِ کامل—نمی‌سنجه. این فقط یک ابزارِه؛ تیز و دقیق، گاهی حتی خیلی هم. ولی در نهایت باز هم فقط یک ابزار.

‍

جوابی که واقعاً باید به خاطر بسپاری

اگر کسی سر سفره شام گیرت بیندازد و بپرسد: «میانگین IQ چقدره؟»، با خیال راحت می‌تونی بگی: ۱۰۰ در تست‌های استاندارد IQ مدرن.

‍

اما حالا می‌دونی جوابِ درست، زیرِ این ماجرا قایم شده. نمره‌ی ۱۰۰ فقط «مرکز کالیبره‌شده» است، نه یک حقیقتِ جادویی درباره‌ی گونه‌ی انسانی. بیشترِ افراد بین ۸۵ تا ۱۱۵ نمره می‌گیرند. نمره‌ها یک «منحنیِ زنگی» می‌سازند. کشورهای مختلف، نمونه‌ها و دهه‌ها می‌توانند میانگین‌های تجربی متفاوتی ایجاد کنند. و معنیِ همین تفاوت‌ها معمولاً خیلی سخت‌تر از چیزی است که اینترنت دوست دارد.

‍

پس دفعه بعد که یک ادعای عجیب و غریب درباره IQ آنلاین دیدی، فقط به عدد خیره نشو. چهار سؤال الکیِ اعصاب‌خردکن بپرس: کی تست شده، با چه تستی، در مقایسه با چه معیارهایی، و با چه هدفی؟ شاید دیگه برای مهمونی‌های کباب دعوتت نکنن، ولی فهمت به شکل چشمگیری بهتر می‌شه.

‍

برای من، همین بخشِ هوش‌پژوهی جذاب‌ترین قسمت است. عددها مرتب به نظر می‌رسند، اما واقعیتِ ماجرا بی‌نهایت دردسرساز و غیرقابل‌چشم‌پوشی است.

‍