গড় IQ হলো 100। এটাই অফিসিয়াল উত্তর, পাঠ্যবইয়ের উত্তর, আর বেশিরভাগ ওয়েবসাইট প্রথম বাক্যেই যা বলে।

এমন উত্তরটাই বুদ্ধিমান মানুষদের সন্দেহপ্রবণ করে, কারণ এটা প্রায় অতিরিক্ত ঝকঝকে শোনায়। আর সত্যি বললে, তোমার সন্দেহটা স্বাস্থ্যকর।

কৌশলটা হলো: IQ গড় উচ্চতার মতো না—যেখানে অনেক মানুষের মাপ নিয়ে একটা সংখ্যা বের করা হয়। আধুনিক IQ টেস্টগুলোকে স্কেল করা হয়, যাতে নর্মিং জনসংখ্যায় গড় স্কোর হয় ১০০। মানে, ১০০ কোনো রহস্যময় সত্য নয়, যা প্রকৃতি পাহাড়ে খোদাই করে রেখেছে। এটা টেস্ট ডিজাইনাররা তৈরি করা একটা রেফারেন্স পয়েন্ট, যাতে স্কোরগুলো সহজে বোঝা যায়।

এটা মানে না যে IQ জাল বা অকেজো। এর মানে হলো আমাদের আরও ভালো প্রশ্ন করতে হবে। “গড় IQ কত?” নয়—বরং “কার জন্য গড়, কোন টেস্টে, কখন সেট করা হয়েছে, এবং কোন গ্রুপের সঙ্গে তুলনা করা হয়েছে?” একবার সেটা জিজ্ঞেস করলে, বিষয়টা অনেক বেশি আকর্ষণীয় হয়ে ওঠে।

১০০ গড়, কারণ টেস্টটা এমনভাবেই বানানো হয়েছে

শুরুর দিকে আইকিউ টেস্টিং আধুনিক টেস্টের মতো একদম কাজ করত না। ফ্রান্সে আলফ্রেড বিনেটের মূল কাজ — আমাদের intelligence এবং IQ tests-এর ইতিহাস বিষয়ক আর্টিকেলে বিস্তারিতভাবে কভার করা আছে — এমন শিশুদের চিহ্নিত করার লক্ষ্য ছিল, যাদের হয়তো বাড়তি শিক্ষাগত সহায়তা দরকার। পরে উইলহেল্ম স্টার্ন আর লুইস টারম্যান জনপ্রিয় করা পুরনো সিস্টেমে “মানসিক বয়স” (mental age) ফর্মুলা ব্যবহার করা হতো: মানসিক বয়সকে কালানুক্রমিক বয়স দিয়ে ভাগ করে, তারপর ১০০ দিয়ে গুণ। এটা শিশুদের ক্ষেত্রে মোটামুটি ভালো কাজ করত, কিন্তু প্রাপ্তবয়স্কতায় দ্রুতই ঝামেলা হয়ে যায়—কারণ “মানসিক বয়স” ডিনার টেবিলে পরিবারসহ হিসাব করে বের করার মতো কিছু নয়।

আধুনিক IQ টেস্টগুলো মনোবিজ্ঞানীরা যাকে deviation IQ বলে তা ব্যবহার করে। ১০ বছরের কেউ ১২ বছরের মতো ভাবে কি না—এটা জিজ্ঞেস করার বদলে, আজকের টেস্টে আপনার পারফরম্যান্সকে আপনার বয়সের অনেক মানুষের বড় একটা স্ট্যান্ডার্ডাইজড নমুনার সঙ্গে তুলনা করা হয়। এরপর কাঁচা স্কোরগুলো এমনভাবে রূপান্তর করা হয় যাতে গ্রাফের গড় হয় ১০০, এবং সাধারণত স্ট্যান্ডার্ড ডেভিয়েশন হয় ১৫।

মেডিকেল রেফারেন্স *Standard of Care* যেমন বলে, আধুনিক আইকিউ স্কোরগুলোকে ১০০ গড় এবং ১৫ স্ট্যান্ডার্ড ডেভিয়েশনসহ একটি স্বাভাবিক বণ্টনে রূপান্তর করা হয়। Psych Central ২০২২ সালের এক সারসংক্ষেপেও একই কথা বলেছে: গড় আর মধ্যক দুটোই ১০০। তাই হ্যাঁ—কেউ যদি প্রচলিত উত্তর চায়, সেটাই ১০০।

কেন ১০০? বেশিরভাগ কারণ এটা সুবিধাজনক। এটা একটা সহজ মাঝামাঝি পয়েন্ট, আর মানুষ স্বাভাবিকভাবেই বুঝে নেয়—এর উপরের সংখ্যা মানে গড়ের চেয়ে বেশি, আর নিচেরগুলো মানে গড়ের চেয়ে কম। টেস্ট বানানোর লোকজন নাটকীয় মুডে থাকলে ৫০০ বেছে নিতে পারত, কিন্তু ভালো যে তারা সেটা করেনি।

এই কারণেই “গড় IQ হচ্ছে ৮৫ থেকে ১১৫-এর মধ্যে” কথাটা একটু ঢিলেঢালা। কড়াভাবে বললে গড় হলো ১০০। ৮৫ থেকে ১১৫-এর এই পরিসরটাই হলো গড় রেঞ্জ—মানে যে ব্যান্ডে বেশিরভাগ মানুষ পড়ে।

সহজ ভাষায় আপনার স্কোরের মানে কী

একবার বুঝে গেলে যে IQ স্কোরগুলো ১০০-এর চারপাশে কেন্দ্রীভূত, এরপর কাজে লাগবে আরেকটা বিষয়: বিস্তার (spread)। বেশিরভাগ বড় IQ টেস্টে স্ট্যান্ডার্ড ডেভিয়েশন থাকে ১৫ পয়েন্ট। এতে আমরা বেল কার্ভের একটা দারুণ সুবিধাজনক মানচিত্র পেয়ে যাই।

প্রায় ৬৮% মানুষ ৮৫ থেকে ১১৫-এর মধ্যে স্কোর করে। প্রায় ৯৫% স্কোর করে ৭০ থেকে ১৩০-এর মধ্যে। কেবল প্রায় ২% স্কোর করে ১৩০-এর ওপরে, আর কাছাকাছি সমান ছোট একটি অংশ স্কোর করে ৭০-এর নিচে। তাই ১৩০-কে প্রায়ই খুব অসাধারণ পারফরম্যান্সের একটা আনুমানিক সীমা হিসেবে ব্যবহার করা হয়, আর ৭০-এর নিচের স্কোরগুলো বুদ্ধিবৃত্তিক অক্ষমতার মূল্যায়নের এক অংশ হতে পারে। তবে ক্লিনিশিয়ানরা শুধু IQ দেখে না বুদ্ধিবৃত্তিক অক্ষমতা নির্ণয় করেন; অভিযোজন ক্ষমতাও—মানে কেউ দৈনন্দিন জীবন কতটা ভালোভাবে সামলায়—খুব গুরুত্বপূর্ণ।

শতকরা র‌্যাঙ্ক (পারসেন্টাইল) এখানেও সাহায্য করে। IQ 100 মানে প্রায় ৫০তম পারসেন্টাইল। IQ 115 মানে কাছাকাছি ৮৪তম পারসেন্টাইল। IQ 130 মানে প্রায় ৯৮তম পারসেন্টাইল। তাই কেউ যদি বলে তার IQ 130, তাহলে সে আসলে বলছে না যে ১০০টার মধ্যে ১৩০টা প্রশ্ন ঠিক করেছে—যেটা গণিতের দিক থেকে দারুণ অসম্ভব। সে বলতে চায়, সে আদর্শ (নর্ম) গ্রুপের প্রায় ৯৮% মানুষের চেয়ে বেশি স্কোর করেছে।

আপনি যখন পার্সেন্টাইল বুঝে যাবেন, তখন বিখ্যাত বেল কার্ভটা আর বিমূর্ত পরিসংখ্যানের দেয়ালচিত্রের মতো মনে হবে না—একটা ম্যাপের মতো লাগতে শুরু করবে। আর সেখান থেকে পরের প্রশ্ন: বাস্তব ডেটা কি সত্যিই এমনভাবে আচরণ করে?

বেল কার্ভ কোনো মিথ নয়

আপনি নিশ্চয়ই অনলাইনে ভাসতে থাকা ক্লাসিক বেল-কার্ভের গ্রাফিকটা দেখেছেন—অনেক সময়ই সেটা থাকে কোনো ভীষণ বিরক্তিকর মতামতের পাশে। সেটা যতই বিরক্তিকর হোক, মূল আকারটা কিন্তু বাস্তব।

আইকিউ টেস্ট এমনভাবে বানানো যাতে মোটামুটি স্বাভাবিক বণ্টন তৈরি হয়—প্র্যাকটিসে সাধারণত সেটাই হয়। রিচার্ড ওয়ার্নে ২০২৩ সালে দেশের গড় আইকিউ অনুমান নিয়ে জটিল গবেষণা পর্যালোচনা করে বলেছিলেন, আইকিউ ডেটা পরিসংখ্যানগতভাবে সাধারণত এতটাই ঠিকভাবে চলে যে গড় হিসাব করতে গেলে প্রচলিত শর্তগুলো ভাঙে না। ব্যাপারটা শুকনো শোনাতে পারে, কিন্তু আসলে গুরুত্বপূর্ণ: গড় স্কোর নিয়ে আপনি সত্যিই যুক্তিসংগতভাবে কথা বলতে পারেন।

মানুষ যে স্টেরিওটাইপ করে, এমন ধরন গ্রুপের মধ্যেও দেখা যায়। ADHD, পড়ায় সমস্যা, বা দুটোই আছে—এমন শিশুদের ওপর এক গবেষণায় মনোবিজ্ঞানী বনি ক্যাপল্যান ও সহকর্মীরা দেখেন, তিনটি গ্রুপেই আনুমানিক ফুল-স্কেল IQ-এর বণ্টনগুলো স্বাভাবিক বণ্টন থেকে উল্লেখযোগ্যভাবে আলাদা নয়; অর্ধেকেরও বেশি শিশু গড়ে রেঞ্জেই পড়ে। তাদের উপসংহার ছিল দারুণ সোজাসাপ্টা: ADHD-সহ শিশুদের ক্ষেত্রে অন্য শিশুদের তুলনায় গড়ের চেয়ে বেশি IQ থাকার সম্ভাবনা বেশি নয়।

আমি এই স্টাডিটা পছন্দ করি, কারণ এটা একসাথে দুটো মিথ ভেঙে দেয়। প্রথমত, বেল কার্ভটা ঠিক জায়গাতেই দেখা যায়—যেটা আমরা আশা করি। দ্বিতীয়ত, ক্লিনিকাল লেবেলগুলো জাদুর মতো করে কাউকে কারও বুদ্ধিমত্তা বলে দেয় না। বাস্তব মানুষরা জেদ করে অনলাইনের স্টেরিওটাইপে ফিট হতে চায় না—যদিও তাদের ওইটা করা সত্যিই একটু বাজে।

এখন ঝামেলার অংশটা শোনো: বাস্তব দলে সবসময় গড় ১০০ হয় না

আইকিউ টেস্ট যদি ১০০-এ নর্ম করা হয়, তাহলে কেন আপনি কখনো পড়েন যে যুক্তরাষ্ট্রের গড় প্রায় ৯৭, বা “বিশ্ব গড় আইকিউ” প্রায় ৮৯? তাহলে কি সরকারি উত্তরটা ভুল?

না। তবে এখানেই গড় আইকিউ শব্দটার মান বদলে যায়।

যখন লেখকেরা কোনো দেশের গড় IQ নিয়ে কথা বলেন, তারা সাধারণত বিভিন্ন নমুনা, ভিন্ন ভিন্ন বছর, আলাদা আলাদা টেস্ট—আর কখনও কখনও বেশ সন্দেহজনক পদ্ধতির ডেটা মিশিয়ে ফেলেন। এটা কোনো টেস্টে তৈরি থাকা ১০০-এর স্ট্যান্ডার্ডাইজড স্কোরের মতো জিনিস নয়।

উদাহরণ হিসেবে Psych Central ২০১৯ সালে যুক্তরাষ্ট্রে গড় IQ ছিল ৯৭.৪৩—এমন একটি হিসাব উল্লেখ করেছে। সংখ্যাটা অসম্ভব নয়, কিন্তু এটা বাতাসে আবহাওয়ার রিপোর্টের মতো ভাসতে থাকা “আমেরিকানদের চিরস্থায়ী” কোনো বৈশিষ্ট্যও না। এটা নির্ভর করে কীভাবে হিসাবটা তৈরি করা হয়েছে তার ওপর।

ওয়ার্নের ২০২৩ সালের রিভিউ এখানে বিশেষভাবে কাজে দেয়, কারণ তিনি দুই পক্ষের কট্টর ভূমিকায়ও যোগ দেন না—একটা পাহাড় থেকে অন্য পাহাড়ে চেঁচামেচি করার মতো। তিনি বলেন না যে জাতীয় IQ ডেটাসেটগুলো একদম নিখুঁত। আবার এটাও বলেন না যে সেগুলো একেবারে মূল্যহীন। তিনি যুক্তি দেন, এসব অনুমানগুলোর কিছু “গুরুত্বপূর্ণ কিছু” ধরতে পারে—তবে একই সঙ্গে তিনি বড় মানের সমস্যা দিকেও ইঙ্গিত করেন, বিশেষ করে যেখানে ডেটা কম বা পুরোনো।

তার উল্লেখযোগ্য একটি পর্যবেক্ষণ হলো—একাধিক স্যাম্পল থেকে দেশের হিসাবগুলো বেশিরভাগ সময় গড়ে মাত্র প্রায় ৫.৮ পয়েন্টের ব্যবধানেই আলাদা হয়। তবে কিছু দেশে ২০ পয়েন্টের বেশি পর্যন্ত পার্থক্য দেখা যায়, কারণ একটি পুরোনো বা নিম্নমানের স্যাম্পল পুরো চিত্রটা বেঁকিয়ে দেয়। তিনি আরও দেখিয়েছেন, ধরে নেওয়া শর্তের ওপর নির্ভর করে, একটি বিতর্কিত ডেটাসেট থেকে গণনা করা বৈশ্বিক গড় প্রায় ৮৬.৭ থেকে ৮৮.৩ এর মধ্যে কোথাও পড়তে পারে। তোমার মাথা এখনই গরম হয়ে যাচ্ছে, বুঝি। তাহলে কি মানুষের “আসল” গড় IQ আসলে ১০০ নয়? তাড়াহুড়া করে সিদ্ধান্ত দিও না।

ওয়ার্নে যেমন জোর দিয়ে বলেন, আইকিউ হলো একটি পরিমাপ—বুদ্ধিমত্তা নিজে নয়। আর গ্রুপের গড় বলে দিতে পারে না পার্থক্যগুলো শিক্ষা, পুষ্টি, স্বাস্থ্য, টেস্টের সাথে পরিচিতি, ভাষা, স্যাম্পলিং বায়াস, বা অন্য কিছুর কারণে হচ্ছে কি না। এগুলো তো কারও অন্তর্নিহিত সম্ভাবনা সম্পর্কেও কিছু জানায় না। আমি এই পয়েন্টটা বিশেষভাবে গুরুত্বপূর্ণ মনে করি, কারণ আইকিউ নিয়ে জনসমক্ষে আলোচনা অনেক সময় একটা দুর্বল সংখ্যাকে ধরেই প্রায় বারো সেকেন্ডে সভ্যতার বিশাল এক তত্ত্বে ছুটে যায়। এটা বিজ্ঞান নয়। এটা Wi‑Fi যুক্ত ক্যাফেইন।

কখনকার তুলনায় গড়? ফ্লিন ইফেক্ট সবকিছু বদলে দেয়

আরেকটা কারণ হলো, গড় IQ ‘স্লিপ’ করে কারণ সময়ের সঙ্গে তুলনার গ্রুপও বদলাতে থাকে।

২০তম শতাব্দীর বেশিরভাগ সময় জুড়ে বহু দেশে আইকিউ টেস্টের কাঁচা স্কোর বেড়েছে। এই ধারা Flynn effect নামে পরিচিত—গবেষক জেমস ফ্লিনের নামে। “Standard of Care” সারাংশে বলা ক্লাসিক অনুমান অনুযায়ী প্রতি দশকে প্রায় ৩ পয়েন্ট আইকিউ বাড়ে। আর ডসিয়ারে পর্যালোচিত বিস্তৃত গবেষণাগুলো প্রভাবটি ২.৯৩ পয়েন্ট প্রতি দশক বলে ধরে—ট্রাহান ও সহকর্মীদের ২০১৪ সালের একটি মেটা-অ্যানালাইসিসে। পরে পিয়েতশ্নিগ ও ভোরাসেকের ২০১৫ সালের মেটা-অ্যানালাইসিসও বড় ধরনের উন্নতি পেয়েছে, তবে বুদ্ধিমত্তার সব ধরনের ক্ষেত্রে সমানভাবে নয়।

এর মানে হলো, তুমি যদি পুরোনো নর্ম ব্যবহার করে আধুনিক কাউকে পুরোনো IQ টেস্ট দাও, তাহলে সে ১০০-এর চেয়ে স্পষ্টভাবে বেশি স্কোর করতে পারে। সেটা অবশ্যই মানুষের মস্তিষ্ক হঠাৎ “টার্বো মোডে” চলে গেছে বলে না—কারণ পরিবেশ বদলেছে: ভালো স্কুলিং, পুষ্টি, স্বাস্থ্যসেবা, আর অ্যাবস্ট্রাক্ট সমস্যা-সমাধানের সঙ্গে পরিচিতি—সবকিছুই সম্ভবত ভূমিকা রেখেছে।

আর এই কারণেই IQ টেস্টগুলোকে আবার ‘নতুন করে স্ট্যান্ডার্ড’ করা (re-norm) দরকার। যদি সেটা না করা হতো, তাহলে “গড়” সময়ের সাথে বেড়ে যেত এবং আর সত্যিকারের গড় থাকত না। সহজভাবে বললে—টেস্ট আপডেট করা থাকায় ১০০ স্থির থাকে। মানে, রুলারটা আবার ক্যালিব্রেট করা হয়।

মজার ব্যাপার হলো, কিছু দেশে এখন ফ্লিন এফেক্ট ধীর হচ্ছে—এমনকি উল্টেও যেতে দেখা যাচ্ছে। তাই স্কোরের দীর্ঘ ঊর্ধ্বগতি কোনো “প্রকৃতির নিয়ম” নয়। বুদ্ধিমত্তা গবেষণার একটা বিরক্তিকর অভ্যাস আছে—যে কেউ অতিরিক্ত আত্মতুষ্ট হয়ে যায়, তাকে শাস্তি দিতে (যদিও সত্যি বলতে, এটা একধরনের কাজে লাগে)।

গড় IQ আমাদের কী বলে—আর এটা একদম কী বলতে পারে না

যদি তুমি শৃঙ্খলাবদ্ধ থাকো, তবে বেশই—কিন্তু তুমি না করলে, মানুষ যতটা চায় ততটা একদমই না।

ব্যক্তিগত পর্যায়ে, আইকিউ টেস্ট সত্যিই কাজে লাগতে পারে। একজন স্কুল সাইকোলজিস্ট এগুলো ব্যবহার করতে পারেন—যে কারণে এক শিশু সাবলীলভাবে পড়ে, কিন্তু ওয়ার্কিং মেমরিতে খুব সমস্যায় পড়ে, বা অন্যজনের কেন আরও উন্নত একাডেমিক ট্র্যাক দরকার। ক্লিনিকে আইকিউ স্কোর উন্নয়নগত অবস্থা বা জ্ঞানীয় অবনতি মূল্যায়নের একটি অংশ হতে পারে। এটা বাস্তব উপকারিতা—কেবল সাইকোমেট্রিক সাজসজ্জা নয়।

দলগতভাবে গড় স্কোর প্যাটার্ন বোঝাতে পারে। তবে বর্ণনা মানে ব্যাখ্যা নয়। আগেই বলেছিলাম, একটি গ্রুপের গড় আপনাকে বলে না কেন সেই গড়টা এমন। এই পার্থক্যটা অবিশ্বাস্যভাবে গুরুত্বপূর্ণ।

উদাহরণ হিসেবে, ডসিয়েতে সংক্ষেপে বলা গবেষণা দেখায় যে পরিবেশ IQ-এর ফলাফলকে বেশ জোরালোভাবে গঠন করতে পারে। ২০০৩ সালের এক বিখ্যাত গবেষণায় এরিক টারকহাইমার এবং সহকর্মীরা দেখেন, দরিদ্র পরিবারে শেয়ার করা পরিবেশই বাচ্চাদের IQ-এর ভিন্নতায় জিনের চেয়ে অনেক বেশি ভূমিকা রেখেছে—এ বিষয়ে আমরা আমাদের নিবন্ধে আলোচনা করেছি বুদ্ধিমত্তা কি বংশগত—তবে সচ্ছল পরিবারে জেনেটিক পার্থক্যই আরও বেশি ভ্যারিয়েন্স ব্যাখ্যা করেছে। এ রকম একটি ফলাফলই এমন, যা যে কোনো দলের—সব মতাদর্শের—মানুষকে এক মিনিট থেমে ভাবতে বাধ্য করা উচিত।

সামাজিক প্রেক্ষাপটও গুরুত্বপূর্ণ। ক্লড স্টিল ও জোশুয়া অ্যারনসন দেখিয়েছেন, মানুষ যখন তাদের দলের সম্পর্কে কোনো নেতিবাচক স্টেরিওটাইপ সত্য প্রমাণ হওয়ার ভয় পায়, তখন স্টেরিওটাইপ থ্রেট টেস্টের পারফরম্যান্স কমিয়ে দিতে পারে। তাই জাতি, দেশ বা “সভ্যতাগত বুদ্ধিমত্তা” নিয়ে বড় বড় দাবির আগেই (এটা ইতোমধ্যেই খারাপ ইঙ্গিত), আমাদের একটা মৌলিক কথা স্বীকার করতে হবে: টেস্টের পারফরম্যান্স শূন্যে তৈরি হয় না।

এই কারণেই আইকিউকে যেন ভাগ্য হিসেবে ধরে নিলে আমি অস্বস্তি বোধ করি। বিজ্ঞান সেটাকে সমর্থন করে না। আইকিউ বাস্তব আর গুরুত্বপূর্ণ একটা বিষয় মাপে, কিন্তু পুরো অর্থে এটা আপনার মূল্য, সৃজনশীলতা, দয়া, বিচারবোধ বা ভবিষ্যৎ—কোনোটাই ঠিকঠাক মাপে না। এটা শুধু একটা টুল। ধারালোও বটে, কখনও কখনও। তবু—একটা টুলই।

যেটা সত্যিই মনে রাখা উচিত উত্তরটা

আপনি ডিনারে কেউ আপনাকে ঘিরে ধরলে এবং জিজ্ঞেস করলে, “গড়ে মানুষের IQ কত?”, নিশ্চিন্তে বলতে পারেন: আধুনিক স্ট্যান্ডার্ডাইজড IQ টেস্টে ১০০

কিন্তু এখন তুমি জানো—লুকানো আছে আরও ভালো উত্তর। ১০০ হলো একটি ক্যালিব্রেটেড সেন্টার; মানুষের প্রজাতি সম্পর্কে কোনো জাদুকরী সত্য নয়। বেশিরভাগ মানুষ ৮৫ থেকে ১১৫-এর মধ্যে স্কোর করে। স্কোরগুলো গড়ে একটি বেল কার্ভের মতোভাবে সাজে। আলাদা দেশ, নমুনা আর দশকে ভিন্ন ভিন্ন এমপিরিক্যাল গড় দেখা যেতে পারে। আর এই পার্থক্যগুলোর মানে বোঝা প্রায়ই ইন্টারনেট যতটা সহজ দেখায়, তার চেয়ে অনেক বেশি কঠিন।

তাই অনলাইনে পরের বার কোনো নাটকীয় IQ দাবির দেখা পেলে শুধু সংখ্যায় তাকিয়ে থেকো না। চারটা বিরক্তিকর প্রশ্ন করো: কাকে পরীক্ষা করা হয়েছিল, কোন টেস্টে, কোন মানদণ্ডের বিপরীতে, আর কী উদ্দেশ্যে? মানুষ হয়তো তোমাকে বারবিকিউতে ডাকাই বন্ধ করবে, কিন্তু তোমার বোঝাপড়া দারুণভাবে উন্নতি করবে।

আমার কাছে বুদ্ধিমত্তা গবেষণার সবচেয়ে মজার অংশ এটিই। সংখ্যাগুলো দেখলে পরিপাটি লাগে। কিন্তু বাস্তবতা দারুণভাবেই ঝামেলাপূর্ণ।