Was IQ-Tests messen und was nicht

Von hmmm.me editorial team · Veröffentlicht am 19. April 2026

Der IQ ist eine seltsame Zahl.

Er ist eine der am besten untersuchten Variablen in der Psychologie. Er prognostiziert Dinge – akademische Leistungen, bestimmte berufliche Leistungen, das Risiko für bestimmte Krankheiten – zuverlässiger als fast alles andere im Bereich der Selbstauskünfte. In den Händen des Internets ist er aber auch eine Zahl, die instrumentalisiert, zu Memes gemacht, persönlich genommen und jedem zugeteilt wird, der innerhalb von fünf Minuten zwanzig Matrixrätsel lösen kann.

Dies ist ein Versuch zu klären, was der IQ tatsächlich ist, was er nicht ist und wie viel ein Testergebnis wirklich aussagt.

Eine sehr kurze Geschichte

Im Jahr 1905 wurde der französische Psychologe Alfred Binet von den öffentlichen Schulen in Paris beauftragt, eine Methode zu entwickeln, um Kinder zu identifizieren, die zusätzliche Förderung benötigten. Er entwarf eine Reihe von nach Alter gestaffelten Aufgaben. Das „mentale Alter“ eines Kindes konnte so mit seinem chronologischen Alter verglichen werden, um festzustellen, wer Schwierigkeiten hatte. Es handelte sich um ein diagnostisches Instrument, das dafür gedacht war, sorgfältig und mit Blick auf die Entwicklung des Kindes eingesetzt zu werden.

William Stern schlug später vor, das mentale Alter durch das chronologische Alter zu dividieren und mit 100 zu multiplizieren – der Intelligenzquotient. Lewis Terman an der Stanford University passte den Binet-Test für den amerikanischen Gebrauch an. Der Stanford-Binet-Test war geboren. David Wechsler fügte später den auf Erwachsene ausgerichteten WAIS hinzu, der bis heute das am häufigsten verwendete klinische IQ-Instrument ist.

Also: Der ursprüngliche Test war ein sorgfältiges, individuell durchgeführtes Diagnostikinstrument. Alles, was in den hundertzwanzig Jahren danach geschah, ist die Geschichte eines Instruments, das in Richtungen gedrängt wurde, die Binet nicht gutgeheißen hätte.

Was ein IQ-Test tatsächlich macht

Ein moderner Test wie der WAIS-IV prüft eine breite Palette von Denkaufgaben in verschiedenen Bereichen: Sprachverständnis, wahrnehmungsgebundenes logisches Denken, Arbeitsgedächtnis und Verarbeitungsgeschwindigkeit. Die Aufgaben sind zeitlich genau getaktet und werden anhand einer Normierungsstichprobe bewertet – einem großen Querschnitt der Allgemeinbevölkerung, angepasst nach Alter und Demografie.

Ihr Ergebnis ist nicht absolut. Es beschreibt eine relative Position. „IQ 115“ bedeutet nicht: „Sie sind 115 Einheiten klug.“ Es bedeutet: „Im Vergleich zur altersgleichen Bevölkerung haben Sie eine Standardabweichung über dem Durchschnitt abgeschnitten.“ Die 100 ist willkürlich – sie ist konstruktionsbedingt als Mittelwert der Bevölkerung definiert. Die Standardabweichung von 15 ist ebenfalls konstruktionsbedingt.

Da der Test an einer Stichprobe normiert ist, werden die Ergebnisse alle paar Jahrzehnte neu normiert. Der Grund dafür ist ein seltsames, gut dokumentiertes Phänomen: Die IQ-Rohwerte sind im letzten Jahrhundert um etwa drei Punkte pro Jahrzehnt gestiegen. Dies wird als Flynn-Effekt bezeichnet, benannt nach dem Psychologen James Flynn, der die Daten durchforstete und darauf hinwies, dass dies zuvor niemandem aufgefallen war.

Niemand weiß genau, warum der Flynn-Effekt auftritt. Bessere Ernährung, mehr Schulbildung, höhere Anforderungen an abstraktes Denken im Alltag, kleinere Familien und ein Rückgang von Kinderkrankheiten spielen wahrscheinlich alle eine Rolle. Das bedeutet, dass ein heute geborenes Kind bei den Rohdaten im selben Test deutlich besser abschneidet als seine Großeltern im gleichen Alter. Und da der IQ auf 100 normiert ist, müssen die Tests regelmäßig neu kalibriert werden, um den Durchschnitt dort zu halten, wo er sein soll.

Was er vorhersagt

Seit etwa einem Jahrhundert wird der IQ mit bestimmten Ergebnissen in Beziehung gesetzt, und das Bild stellt sich ungefähr so dar:

Starke Vorhersagekraft für Leistungen bei kognitiv anspruchsvollen Aufgaben. Schulnoten, standardisierte Testergebnisse, Leistungen in informationsintensiven Berufen.
Moderate Vorhersagekraft für die allgemeine Arbeitsleistung. Der Effekt schrumpft, je weniger kognitiv anspruchsvoll die Arbeit ist.
Schwache Vorhersagekraft für das Einkommen, sobald man den Bildungsabschluss kontrolliert. Kluge Kinder mit reichen Eltern haben einen entscheidenden Vorteil.
Keine Vorhersagekraft für Lebenszufriedenheit, abgesehen von dem Punkt, an dem die kognitive Fähigkeit den Zugang zu einem stabilen Arbeitsplatz beeinflusst.
Keine Vorhersagekraft für Weisheit, Kreativität jenseits einer bescheidenen Schwelle oder die meisten zwischenmenschlichen Eigenschaften.

Die Erkenntnis daraus ist nicht, dass der IQ allmächtig ist. Die Erkenntnis ist vielmehr, dass er real und von Bedeutung ist, aber eben auch nur eine Variable unter vielen.

Was ein kurzer Online-”IQ-Test” tatsächlich misst

Ein Quiz mit zwanzig Fragen – wie das auf dieser Website – deckt ein oder zwei der Denkarten ab, die ein echter IQ-Test misst. Es ist nicht normiert. Ihr Ergebnis wird anhand der Leistung bei genau diesen spezifischen Fragen kalibriert, nicht an einer Bevölkerungsstichprobe.

Was sagt Ihnen das Ergebnis eines Online-Quiz? Ehrlich gesagt, wenig. Es sagt Ihnen ungefähr, ob Sie diese Rätsel als einfach, mittelschwer oder schwer empfunden haben. Es sagt Ihnen nicht, wo Sie bei einem klinischen Instrument landen würden. Wenn Sie das Quiz an zwei verschiedenen Tagen machen würden, bekämen Sie deutlich unterschiedliche Ergebnisse.

Wenn Sie eine echte Messung wollen, brauchen Sie einen klinischen Psychologen, ein paar Stunden Zeit und etwas Geld. Für die meisten Menschen lohnt sich das in der Regel nicht.

Über das kulturelle Gewicht der Zahl

Eine letzte Sache, weil es erwähnenswert ist. Der IQ hat eine lange, hässliche Geschichte als Instrument zur Rechtfertigung von Vorurteilen – bezüglich ethnischer Herkunft, sozialer Klasse, Einwanderung und der Frage, wem was zusteht. Ein Teil dieser Geschichte ist immer noch aktiv. Sorgfältige Psychologen sind sich dessen heute sehr bewusst. Unachtsame Kommentatoren sind es nicht.

Wenn Sie bei diesem Quiz schlecht abschneiden, sind Sie nicht dumm. Jede validierte IQ-Messung hat breite Fehlertoleranzen und große tägliche Schwankungen. Zwanzig Fragen im Internet haben noch wesentlich größere Fehlertoleranzen. Und selbst eine sorgfältige klinische Messung gibt nur Auskunft über die Leistung bei spezifischen kognitiven Aufgaben, was etwas sehr viel Engeres ist als die Frage, “wie schlau Sie sind.”

Wenn Sie ein hohes Ergebnis erzielen, ist das schön, hat aber auch keine tragende Bedeutung. Kognitive Fähigkeiten sind wichtig, aber die Liste der Menschen, die schlau und gleichzeitig unglücklich, wenig hilfsbereit oder festgefahren sind, ist lang.

Betrachten Sie die Rätsel als das, was sie sind: Rätsel. Freuen Sie sich über die, die Sie lösen, seien Sie neugierig auf die, die Sie nicht gelöst haben, und machen Sie weiter.

Machen Sie unser kurzes Quiz — 20 Fragen, etwa fünf Minuten.