Jungenkrise – nächste Runde der Propagandaschlacht

Warum gibt es eigentlich keinen literacy-Test für Journalisten? Es wäre an der Zeit sicherzustellen, dass Journalisten, die sich eines Themas annehmen, auch eine rudimentäre Idee davon haben, wovon sie schreiben, insbesondere wenn sie über vermeintliche wissenschaftliche Ergebnisse berichten, wie dies Florian Rötzer auf Telepolis tut.

Herr Rötzer bespricht eine Meta-Analyse, die Daniel Voyer und Susan D. Voyer gerade im Pychological Bulletin untergebracht haben, eine Meta-Analyse, die Herr Rötzer offensichtlich nur vom Text der Pressemeldung und vom Abstract her kennt und die ihn dennoch zu den folgenden Überschriften hinreißt:

“Mädchen haben schon seit 100 Jahren bessere Schulnoten als Jungen. Von einer aktuellen ‘Jungenkrise’, die gegenüber den Mädchen ins Hintertreffen geraten, kann man daher nicht sprechen”.

Hurrelmann BildungsverliererMan beachte die ironischen Anführungszeichen, die Herr Rötzer benutzt, um all die Deppen, die aus seiner Sicht von einer Jungenkrise fabulieren, gleich in der Überschrift lächerlich zu machen. Im der Überschrift nachfolgenden Text berichtet Herr Rötzer, was er aus Abstract und Pressemeldung über die Meta-Analyse weiß, und weil er Klaus Hurrelmann nicht zu mögen scheint, wird Hurrelmann ausgesondert um Pate zu stehen, für all diejenigen, die von einer Jungenkrise phantasieren, die es doch gar nicht gibt, wie die Meta-Analyse der beiden Voyers gezeigt haben soll.

“Schon fast ein Jahrhundert lang hätten Mädchen, wenn man die gesamte Schulzeit und nicht nur einzelne Tests betrachtet, besser als die Jungen abgeschnitten”, schreibt Florian Rötzer. Deshalb gibt es keine Jungenkrise.

Aber stimmt das auch.

Wir haben im Gegensatz zu Florian Rötzer die Meta-Analyse der beiden Voyers gelesen, alle 21 Seiten davon, und, naja, fangen wir vorne an.

Eine Meta-Analyse ist eine Methode, die auf den von anderen publizierten Ergebnissen aufbaut. D.h. man sammelt publizierte Ergebnisse zu in diesem Fall schulischen Leistung von Jungen und Mädchen. Nun kann man nicht einfach alles sammeln, weil sonst die Gefahr besteht, dass man Äpfel mit Birnen vergleicht. Entsprechend beginnt eine Meta-Analyse damit, dass Kriterien aufgestellt werden, die die gesammelten Untersuchungen erfüllen müssen, damit sie in die Meta-Analyse aufgenommen werden können. Wenn man untersuchen will, welche Ergebnisse es zum Abschneiden von Jungen und  Mädchen im Bildungssystem gibt, dann ist es vorteilhaft, wenn die gesammelten Untersuchungen auch sagen, wie viele Jungen und wie viele Mädchen sie in ihrem Sample berücksichtigt haben.

Bei den Voyers lesen sich die Einschlusskriterien wie folgt:

“The specific criteria used in making inclusion decisions required studies to have both male and female participants in Grade 1 (elementary school) or later. A study had to report teacher assigned official subject/school marks or global GPA (Grade Point Average) to be included” (4).

BorensteinWie sich zeigt, herrscht schon bei der Bestimmung dessen, was als abhängige Variable genutzt werden soll, ein gewisses Durcheinander, d.h. die Art und Weise, wie die Leistung von Schülern in Schulen gemessen wurde, ist nicht einheitlich. Sie umfasst vielmehr ein Sammelsurium von Maßen für schulische Leistung, von denen niemand weiß, was sie messen und ob sie miteinander Vergleichbares messen.  Das ist der erste Verstoß gegen die Standards, die der Durchführung einer Meta-Analyse zu Grunde liegen.

Doch damit nicht genug. Obwohl die Autoren hier die Regeln angegeben haben, nach denen sie Untersuchungsergebnisse in ihre Meta-Analyse aufgenommen haben, brechen sie wenig später mit ihren eigenen Regeln:

“… in some cases females in a sample had to be estimated as equal as only a total sample size was provided. … Accordingly, gender composition was coded into four categories: more females than males, equal number of each gender, more males than females, and estimated composition of samples” (5).

Warum die Autoren zuerst Kriterien angeben, die die Untersuchungsergebnisse erfüllen müssen, um in die Meta-Analyse aufgenommen zu werden und dann ihre eigenen Kriterien brechen, ist ein Geheimnis, das sie leider nicht gelüftet haben.

Möglicherweise hängt es mit dem Veröffentlichungsjahr der berücksichtigten Untersuchungen zusammen, jener Variablen, die für die Rötzersche Behauptung, dass schon seit fast einem Jahrhundert “Mädchen … besser als die Jungen abgeschnitten” hätten, so wichtig ist. Möglicherweise wären die wenigen alten Untersuchungen aus der Meta-Analyse gefallen, hätten die Autoren ihr eigenes Kriterium ernst genommen.

Über 100 Jahre sollen die Untersuchungen, die die Voyers in ihrer Meta-Analyse berücksichtigt haben, überspannen. Eine beeindruckende Leistung, wenn man bedenkt, dass die Zeit der empirischen Sozialforschung Mitte der 1930er Jahre in den USA erst beginnt. Entsprechend ist Tabelle 1 der Meta-Analyse, die die berücksichtigen Studien und die berücksichtigen Ergebnisse der Studien auflistet, von besonderem Interesse.

Wir haben uns die Mühe gemacht, die Ergebnisse aus den 100 Jahren Bildungsforschung, die die Voyers in ihrer Meta-Analyse berücksichtigt haben, nach Jahrzehnten auszuzählen, die folgende Abbildung zeigt das Ergebnis.

Voyer2014_Effektzahl

Wie die Abbildung deutlich macht, basieren die Ergebnisse der Meta-Analyse von Voyer und Voyer, die angeblich ein Jahrhundert umfassen sollen, im Wesentlichen auf Ergebnissen, die nach 1970 publiziert wurden. Die Meta-Analyse hat zudem eine erhebliche Schlagseite nach 1990, also in genau den Jahren, in denen die Jungenkrise in der Forschung virulent geworden ist.

Es kommt noch schlimmer. Die fünf Effekte, die für den Zeitraum 1910 bis 1919 ausgewiesen sind, stammen allesamt aus derselben Untersuchung, die Frailey und Crain (1914) durchgeführt haben, und zwar mit 14 männlichen und 18 weiblichen Schülern einer middle und einer high-school in den USA. Überhaupt stammen alle Untersuchungen vor 1960 aus Nordamerika, mit einer bemerkenswerten Ausnahme aus dem Jahr 1932 in dem Busemann und Harders “Die Wirkung väterlicher Erwerbslosigkeit auf die Schulleistung der Kinder” untersucht haben.

Immerhin haben Busemann und Harders 840 männliche und 787 weibliche Grundschüler untersucht, was ihren Ergebnisse deutlich mehr Gewicht gibt, als den Ergebnissen von Frailey und Crain, die lediglich 32 Schüler berücksichtigt haben. Aber Voyer und Voyer sind hier nicht sonderlich wählerisch: Sie nehmen jede Studie und weisen jeder, egal ob auf 32 oder auf knapp 100.000 Schülern basierend, wie die Untersuchung von Lekholm und Cliffordson (2008) dasselbe Gewicht zu – der zweite Verstoß gegen die Standards einer Metaanalyse.

Aber es geht noch schlimmer, denn nicht nur werden Ergebnisse, die auf der Untersuchung von 32 Schülern basieren, Untersuchungen, die auf den Ergebnissen von rund 100.000 Schülern basieren, gleichgeordnet, nein, dieselbe Studie geht mit mehreren Effekten in die Meta-Analyse ein. So tragen die 32 Schüler aus der Untersuchung von Frailey und Crain (1914) fünf Effektgrößen zur Meta-Analyse bei, während die 100.000 Schüler der Untersuchung von Lekholm und Cliffordson es gerade einmal auf drei Effektgrößen bringen. Die mehrfache Berücksichtigung derselben Untersuchung in einer Meta-Analyse ist ein heftiger Verstoß gegen die Regeln von Meta-Analysen, und er ist den Autoren bewusst:

“However, many of the retrieved studies reported effect sizes for two or more content areas from the same participants, resulting in a sample that violates the assumption that effect sizes should be independent from each other” (15).

Was tut man, wenn man ein formales Kriterium, das an die Verwendung einer Methode gestellt wird, nicht erfüllen kann. Man behauptet, eine andere Methode würde dieses Kriterium nicht benötigen. Entsprechend preisen Voyer und Voyer einen Multi-Level-Ansatz, von dem sie wenig mehr anzugeben vermögen, als dass er Multi-Level ist und kein Problem mit der fehlenden Unabhängigkeit der Einzeleffekte hat.

Was soll man dazu sagen, außer: Oh Graus! Nicht allein, dass die Analysen durch eine fehlende Standardisierung der unterschiedlich großen Ausgangssamples (Anzahl der Befragten) kaum valide Ergebnisse produzieren können, die Tatsache, dass viele Effekte aus derselben Untersuchung stammen, verweist die sowieso nicht sonderlich vertrauenswürdigen Ergebnisse vollständig in den Bereich der Phantasie, wo sie, nachdem schon für einige der berücksichtigen Untersuchungen die Anzahl der männlichen und weiblichen Befragten geschätzt wurde, sowieso hingehören.

Bernstein pedagogy control identityVoyer und Voyer sind davon jedoch wenig beeindruckt und verkünden das, was Herr Rötzer so willig aufgenommen hat, nämlich dass es keine Jungenkrise gibt, weil Mädchen seit einem Jahrhundert bessere Leistungs-Bewertungen zeigen als Jungen. Nun ist der Effekt, den Voyer und Voyer trotz aller Anstrengung finden, eine sehr kleiner Effekt, überhaupt, so schreiben sie: “when considering the magnitude of the effects, it might be tempting to conclude that many of the estimates presented in Table 2 and 3 are so small as to reflect nonexisting gender differences” (19). Weil aber nicht sein kann, was nach Ansicht der Autoren und nach Ansicht von Herrn Rötzer nicht sein darf, wird die Konsistenz von Ergebnissen gefeiert, die so gering sind, dass sie kaum relevant sind, die Konsistenz seit 1914, seit Frailey und Crain 32 Schüler von vornehmlich einer High School in den USA untersucht haben.

Die Interpretation der Ergebnisse ist kurz davor, die eigenen Daten zu verfälschen, und sie ist mit Sicherheit eines nicht: korrekt. Aber, wo es um die billige Schlagzeilen geht, da zählen derart methodische Bedenken, da zählen Standards wissenschaftlicher Lauterkeit nicht. Und die beiden Voyers haben ja Recht, man muss bloß ein bischen erfinden, und wenn es in den politischen Mainstream passt, dann fallen die Journalisten nur allzu bereitwillig auf die Erfindung herein, schon weil sie kein Urteilsvermögen haben, das es ihnen erlauben würde, ein Ergebnis selbst einzuschätzen.

Die Ergebnisse der Meta-Analyse von Voyer und Voyer sind demnach das Papier nicht wert, auf dem sie gedruckt sind. Aber selbst wenn man den beiden Autoren und Herrn Rötzer entgegenkommt und kurz annimmt, die gefundenen Ergebnisse würden der Realität entsprechend und Mädchen erhielten seit rund einem Jahrhundert gleiche bis geringfügige bessere Bewertungen in Schulen als Jungen –

und dann?

Dann müsste man konstatieren, dass an Voyer und Voyer und nicht zu vergessen an Florian Rötzer ein Jahrhundert der Bildungsforschung vorbeigegangen ist, ein Jahrhundert, in dem sich Bildungsforscher bemüht haben, den Einfluss von Institutionen auf Bildungsergebnisse darzustellen. Denn: schulische Leistungs-Bewertungen haben nur sehr vermittelt etwas mit schulischen Abschlüssen zu tun. Und die Krise der Jungen ist keine Krise der schulischen Leistung, hier zeigen PISA und andere Studien, dass Jungen zuweilen besser, zuweilen etwas schlechter abschneiden als Mädchen.

Die Krise der Jungen zeigt sich darin, dass Jungen seltener ein Abitur erreichen als Mädchen, häufiger einen Hauptschulabschluss oder keinen Schulabschluss vorzuweisen haben als Mädchen, dass sie häufiger auf Sonderschulen landen als Mädchen…. All dies sind institutionelle Effekte, die sich aus einer ungleichen Behandlung von Jungen und Mädchen durch Vertreter von Bildungsinstitutionen ergeben. Und wenn Jungen nur unwesentlich schlechtere Leistungen erbringen als Mädchen, wie die Voyers herausgefunden haben wollen, dann ist zu erklären, wieso diese geringfügig schlechteren Leistungen von Jungen sich zu erheblichen Nachteilen im Hinblick auf den Bildungsabschluss auswachsen.

Und wird die Tatsache, dass die Bildungs-Karrieren vieler Jungen frühzeitig durch Abschieben auf Hauptschulen oder Sonderschulen, durch schlechtere Grundschulempfehlungen als sie Mädchen erhalten, beendet wird, dadurch aufgewogen oder gar gerechtfertigt, dass Mädchen angeblich seit einem Jahrhundert geringfügig bessere Schulleistungen erbringen? Was soll diese Behauptung verändern? Ist ein Mord nicht so schlimm, wenn der Ermordete einer kinderreichen Familie entstammt? Ist Bildungsbenachteiligung nicht so schlimm, wenn man die Benachteiligung mit Pseudo-Argumenten begründet? Dieser neuerliche Versuch, existente schulische Nachteile von Jungen aus der Welt zu reden, zeigt im besten Fall die völlige Unkenntnis dessen, worum es eigentlich geht. Im schlimmsten Fall ist es ein neuer Versuch, die Benachteiligung von Jungen wegzureden. In jedem Fall ist es Ideologie und für Wissenschaftler inakzeptabel.

 

Voyer, Daniel & Voyer, Susan D. (2014). Gender Differences in Scholastic Achievement: A Meta-Analysis.

Translate »
error: Content is protected !!