Von Milgram bis Robbers Cave: 5 klassische Experimente und was sie heute wert sind
Grausame Gefängniswärter, die mit Trillerpfeifen Insassen piesaken, ja quälen? Entfesselte Jugendliche im Wir-gegen-die-anderen-Modus? Hollywood hat manch sozialpsychologisches Experiment zum Filmstoff gemacht. Die Erkenntnisse daraus haben sich in unseren Köpfen festgesetzt und formen unser Weltbild. Doch was wäre, wenn die Schlüsse keineswegs so eindeutig, möglicherweise sogar falsch wären?
Sozialpsychologische Experimente sind Kunst — sie zu entwickeln erfordert einiges an Fantasie. Vielleicht kein Wunder, dass das die Sozialpsychologie einige publikumswirksame “Stars” hervorbrachte – ganz im Gegensatz etwa zur trockeneren differenziellen Psychologie oder anderen viel weniger schillernden Psychologie-Teildisziplinen.
Experimente sind Kunst
Um wissenschaftlichen Standards zu genügen, müssen sozialpsychologische Experimente objektiv sein, ihre Ergebnisse unabhängig vom Durchführenden reproduzierbar. Doch das Design von Experimenten allein ist schon sehr kreativ. Das mag einige verführt haben: In manchen Experimenten agierte der jeweilige Studienleiter beinahe wie ein Regisseur, der ein Drehbuch umsetzt. Eitelkeit und Lust am wissenschaftlichen Diskurs gehen nicht nur hier eine starke Verbindung ein. Und Hypothesen will man im wissenschaftlichen Diskurs zwar verwerfen, doch ein reihenhaftes Hpyothesenstreichen widerspricht dann auch dem eigenen Ethos
So sind die fantasievollsten Experimente oft besonders medienwirksam. Psychologen wie Stanley Milgram und Philipp Zimbardo machten diese weltberühmt.
Doch was steckt wirklich in diesen Experimenten? Was können wir aus heutiger Sicht davon lernen? Im Folgenden stelle ich fünf bekannte Experimente vor und ordne sie historisch ein. Ich beschreibe den jeweiligen Versuch und stelle kritische Stimmen entgegen. Dann erlaube mir eine eigene Interpretation.
Auf die Idee zu dieser Einordnung hat mich Rutger Bregmanns Bestseller „Im Grunde gut“ gebracht. Dieses Buch ist grandios geschrieben, aber hinterließ bei mir nach anfänglicher Begeisterung auch einen Beigeschmack und Fragezeichen. Ja, Bregmann zeigt konsequent die andere Seite – der Mensch ist gut. Aber tut Bregmann nicht genau dasselbe wie jene, die nur das Böse sehen? Verdreht er die Fakten nicht ebenso wie die, die er auseinandernimmt, teils genüsslich?
Die Wahrheit liegt wie so oft in der Mitte und zugleich im Niemandsland. Dieser Beitrag soll ein wenig dazu beitragen, Sowohl-als-auch und Differenzierung hinzuzufügen. Und die Frage beantworten: Was nutzt uns das, was an Erkenntnissen bei Experimenten herauskam, heute noch?
1. Robbers Cave: Wir gegen die anderen
Wie verhalten sich Menschen in Gruppen? „Das Robber´s Cave Experiment“ des amerikanisch-türkischen Psychologen Mustafer Sherif ist auch als „Ferienlagerexperiment“ bekannt. Sherif führte drei dieser Ferienlagerexperimente durch: 1949 in Connecticut, 1953 im Staat New York und 1954 unter dem Namen “Robber´s Cave Study” in Oklahoma. Mit diesem letzten Experiment wurde Sherif berühmt. Teilnehmer waren 22 Jungen im Alter von 9 bis 12 Jahren, alle weiß. Keine Mädchen.
Die erste Phase war bei Robber´s Cave die Gruppenbildung, dabei stand das „Bonding“ im Vordergrund, das heißt es sollten Kontakte und Beziehungen untereinander entstehen. In der zweiten Phase teilten die Forscher die Gruppen, und zwar so, dass sie die bereits befreundeten Jungen voneinander trennten. Es formten sich zwei Gruppen, die Eagles und Rattlers.
In den folgenden Tagen bildeten sich in beiden Gruppen Verhaltensnormen aus, die auf Wettbewerb gegen die jeweils andere Gruppe ausgerichtet waren. Außerdem zeigte sich, wer Anführer war und wer folgte. Die Beobachter notierten: Jungen, die Gruppen-Normen verletzten, bestafte die Gruppe.
Im Folgenden Teil des Experiments ging es darum, gegeneinander anzutreten, etwa im Baseball.
Bald teilten die Jungs verbale Attacken und negative Charakterisierungen für die jeweils andere Gruppe aus. Sherif hatte in seinen Hypothesen vorausgesagt, dass ein solch gruppenübergreifender Wettbewerb zu Feindseligkeiten zwischen den Gruppen, negativen Stereotypen und einer verstärkten Solidarität innerhalb der Gruppe führen würde. So war es dann auch.
Schließlich wurden die beiden Gruppen wieder zusammengebracht. Jetzt sollten sie um rare Ressourcen wie einen Wassertank buhlen. Sie hatten damit ein gemeinsames, übergeordnetes Ziel, welches sie wieder miteinander verband. Sherif schloss daraus, dass Ziele Gruppen und Menschen zusammenbringen.
Kritik am Experiment äußerte die australische Psychologin und Wissenschaftsjournalistik Gina Perrry, auf die sich auch Rutger Bregmann (“Im Grunde gut”) immer wieder beruft. Sie schrieb in „The Lost Boys“, dass die Jungen von den Studienleitern angestachelt worden seien. Die Studienleiter hätten bewusst auf “wir gegen die anderen” getrimmt.
- Beschreibung des Experiments: http://psychclassics.yorku.ca/Sherif/index.htm
- Video
Historische Einordnung
Zu jener Zeit waren geschlechter-getrennte Ferienlager normal. Rassentrennung bestimmte den Alltag. Die Gruppe war schon aus diesen Gründen nicht divers besetzt. Der Begriff „Framing“ war noch nicht geboren und die Studienleiter handelten aus einem Bewusstsein, in dem der Begriff “construct-aware” sich noch nicht gebildet hatte, als sie Anweisungen gaben. Eine Fragestellung wie etwa die, ob die Gruppengröße ein Einflussfaktor sei, flossen nicht ein. Bei aller Kritik an der Studie wird ausgeblendet, worum es Sherif in Phase 3 eigentlich ging, nämlich das übergeordnete Ziel, welches die Gruppe verbindet.
Dass Ziele Orientierung geben, bewiesen Latham und Locke 1984 in ihrer Zielsetzungstheorie, die die SMART-Welle in Gang setzte. Heute deutet immer mehr darauf, dass gemeinsamer Sinn verbindet. Bregmann bringt das Beispiel von fünf Jungen auf einer einsamen Pazifikinsel, die ein Jahr dort lebten. Ohne sich zu bekriegen, sondern in gegenseitiger Unterstützung. Er rechnet dabei mit dem Roman “Herr der Fliegen” ab, der ein reines Fanmtasieprodukt sei, aber unser Bild von Wettbewerb und Zwietracht in Gruppen geformt hätte.
Wert für die heutige Zeit
Was Sherif eigentlich tat, war ein „Framing“ für verschiedene Situationen – und die Studie zeigt durchaus, wie dieses gelingen kann und wie es wirkt. Der Name „Rattlers“ und „Eagles“ kam von der Studienleitung — allein dadurch entstand schon ein Handlungsrahmen. Sprache formt Verhalten.
Auch wenn Perrys Verdacht stimmt, dass die Versuchsleiter bewusst Zwietracht säten, so zeigt auch das nur, was sich in Gruppen immer offenbart – sie bilden Normen aus, die ein Zusamnenleben ermöglichen. Auf welche Art und Weise das geschieht, ist von vielen Faktoren abhängig. Wettbewerb ist jedenfalls — so unsere Beobachtung — keinesfalls eine logische Konsequenz. Strukturen bilden sich so oder so aus. Ein positiver Rahmen kann aber die Richtung beeinflussen, in der das geschieht.
2. Das Milgram-Experiment: Sind wir alle Obrigkeitshörig?
1961 wollte der Psychologe Stanley Milgram testen, wie sich durchschnittliche Personen verhalten, wenn sie autoritäre Anweisungen bekommen. Folgen Sie auch dann noch den Anweisungen, wenn diese das Gewissen berühren?
Die Teilnehmerinnen wurden aus der Stadt New Haven rekrutiert. Ihnen wurden zufällig Rollen zugewiesen. Ein „Lehrer“ war die eigentliche Versuchsperson. Er sollte einem „Schüler“, der in Wahrheit Schauspieler war, bei Fehlern einen elektrischen Schlag versetzen. Die Intensität musste nach jedem weiteren Fehler erhöht werden. Der Schüler war in einem Nebenraum an einen Stuhl gebunden, sein „Stöhnen“ (bei leichten Schlägen) und „Brüllen“ (bei starkem Schlag) war für den Lehrer hörbar.
Die Schläge begannen bei 15 Volt und ließen sich bis 450 Volt steigern, natürlich nicht in echt. Am Schockgenerator befanden sich Aufschriften von „leichtem Schock“ bis zu „bedrohlichem Schock“. Der Versuchsleiter gab standardisierte Bemerkungen wie „Bitte, fahren Sie fort!“
Es gehorchten in der ersten Variante des Experiments 26 von 40 Versuchspersonen, also 65 Prozent bis zum letzten Schock. Die Forscher variierten das Experiment, sorgten etwa für mehr menschliche Wahrnehmung bei den “Lehrern” oder auch für Abstand. War der Versuchsleiter nur am Telefon, verweigerten sich mehr Personen, die Gehorsamkeit nahm ab.
Historische Einordnung
Das Experiment passt in die damalige Nach-Hitler-Zeit. Züchtigen gehörte zur Erziehung. Noch in den 1950er Jahren war körperliche Strafe eine ganz normale Erziehungsmethode für Eltern und Lehrer. Aber das Experiment fiel eben auch in die Nachkriegszeit: Adolf Eichmann, der sechs Millionen Juden mit auf dem Gewissen hatte, wurde 1962 hingerichtet. Fünf Psychologen hatten ihn untersucht und als „normaler als normal“ eingestuft. Die Philosophin Hannah Arendt beschrieb dieses Phänomen mit dem Ausspruch „die Banalität des Bösen“. Dieser “Wolf im Schafspelz” in Menschen faszinierte, schockierte und polarisierte. Das Experiment bestätigte all die, die meinten, eine Uniform reiche, um aus Durchschnittsbürgern Monster zu machen. In ihrem Buch “Behind the Shock Machine” von 2012 enthüllte die Australierin Gina Perry allerdings, das einige der Teilnehmer sich im Experiment selbst in einem Film wähnten.
- Im Ärzteblatt ist das Experiment sehr gut beschreiben.
- Im Atlantic findet sich ein ausgewogener Artikel, dier das Experiment in den Zeitkontext einordnet.
Wert für die heutige Zeit
Diagnostische Instrumente der damaligen Zeit berücksichtigen die horizontale Persönlichkeitsentwicklung von Erwachsenen kaum oder gar nicht. In den 1960er Jahren startete Jane Loevinger auch vor diesem Hintergrund ihre Untersuchungen der Ich-Entwicklung (hier ein Beitrag in meinem persönlichen Blog). Sie fand in ihren Daten einen Master Trait, der das Auftreten anderer Persönlichkeitseigenschaften moderierte. Heute wissen wir, dass dieselben Eigenschaften sich höchst unterschiedlich zeigen können. Situation und Kontext spielen jedoch die zentrale Rolle. Zudem haben sich gesellschaftliche Normen geändert.
Es bleiben zwei Erkenntnisse:
- Menschen können im Glauben handeln, dass sie etwas Gutes tun, aber dabei aus der moralisch-ethischen Sicht der Folgegeneration und aus anderen Brillen „böse“ handeln.
- Die Nähe zum Anderen und die Beziehung spielen eine ganz entscheidende Rolle. Je näher ich jemanden komme, desto weniger werde ich ihn/sie als Objekt sehen können.
3. Das Stanford Prison Experiment: Uniform schafft Ungeheuer
Das Stanford-Prison-Experiment sollte vor Augen führen, wie sich Menschen als Gefängniswärterinnen verhalten. Den Versuch füjrte Philipp Zimbardo 1971 an der Stanford Universität durch. Die Wärterinnen hatte das Forscherteam um Zimboardo unter Studenten über eine Annonce rekrutiert. Sie hatten Personen ausgewählt, die in einem Persönlichkeitstest besonders durchschnittlich abschnitten. Die Aufgabe der Wärterinnen war, uniformiert und mit einer Trillerpfeife um den Hals, im Gefängnis für Recht und Ordnung zu sorgen. Eine Ausbildung hatten sie dazu nicht erhalten.
Die Wärter entwickelten im Laufe des Experimentes eine zunehmende Brutalität gegenüber den Insassen. Das ging soweit, dass die Wissenschaftler das Experiment vorzeitig abbrechen mussten, da sich eine ausufernde Brutalität bei den Wärtern entfachte. Etwa ein Drittel zeigte ein regelrecht sadistisches Verhalten, zwei Drittel war streng, ohne brutal zu werden.
Kritiker bezweifeln die korrekte Durchführung sowie die Ergebnisse des Experiments. Die Studenten, die an dem Experiment teilgenommen hatten, sagten später aus, sie seien vom Studienleiter angestachelt worden. Außerdem wähnten sich einige nach späteren Aussagen in einem Film.
Historische Eindordnung
Adolf Eichmann, der sechs Millionenen Juden mit auf dem Gewissen hatte, wurde 1962 hingerichtet. Er war von fünf Psychologen untersucht und als „normaler als normal“ eingestuft worden. Die Philosophin Hannah Arendt brachte dieses Phänomen mit dem Ausspruch „die Banalität des Bösen“ auf den Punkt. Gina Perry hat das Experiment in ihrem Buch “Behind the Shock Machine” analysiert und enthüllt, das auch hier ähnlich wie bei dem Milgram-Experiment, sich einige der Teilnehmer selbst in einem Film wähnten. Dennoch ist auch in unserer Zeit ein “Abu Graib” möglich gewesen — womit wir wieder beim Kontext sind, bei der Führung, bei wirklichen Normen.
Wert für die heutige Zeit
Der Kontext gestaltet den Inhalt. Das zeigt sich hier besonders deutlich. Wenn Menschen keine Ausbildung erhalten, dann agieren sie anders, z.B. so wie sie vermuten, dass es richtig ist oder erwartet wird. Sie fügen sich eher in die Stereotypen eines Berufsbildes, die Diskussion um die amerikanische Polizeiausbildung fügt sich hier gut hinein. Eine Ausbildung muss auch Normen und Grundannahmen vermitteln. Gruppendruck spielt fraglos eine große Rolle, wenn sich Gewalt entwickelt. Wohl ist es fraglos so, dass eine Uniform entpersonalisiert, “das bin ich nicht”, gleichwohl gelten an sie geknüpfte Normen und Erwartungen, die der Uniformträger erfüllen wird, sofern er sich mit seiner Gruppe identifiziert.
4. Der Rosenthal Effekt (auch Pygmalion-Effekt): Intelligenz ist eine Frage der Einstellung
Fördert allein die Einstellung zu einem Schüler dessen Entwicklung? 1965 untersuchten die US-amerikanischen Psychologen Robert Rosenthal und Lenore F. Jacobson an einer Grundschule, wie sich die Einschätzung der Lehrer auf die Intelligenzentwicklung der Schüler auswirkt.
Die Wissenschaftler erzählten den Lehrern, dass auf der Basis eines wissenschaftlichen Tests die Leistungspotenziale der Kinder eingeschätzt worden seien. Dadurch hätten sie jene 20 Prozent Schülerinnen einer Schulklasse identifiziert, bei denen mit einem Entwicklungsschub zu rechnen sei. In Wirklichkeit hatte das Forscherteam die 20 Prozent zufällig per Los bestimmt. Der Test mass in Wahrheit den IQ.
Acht Monate später wiederholten die Forscher den Test. Die IQ-Steigerung war bei den Kindern, denen man Wachstumspotenziale zugesprochen hatte, deutlich größer ausgefallen als bei den restlich en Schülern, also der Kontrollgruppe. Die so genannten “Aufblüher” hatten die Lehrer offensichtlich allein dadurch motiviert, dass sie an ihre Entwicklung glaubten.
Dieses Experiment ist ein Folgeexperiment eines früheren, bei dem zwölf Studenten jeweils fünf Laborratten betreuten. Der einen Hälfte der Studenten teilten die Studienautoren mit, dass ihre Ratten darauf gezüchtet seien, einen Irrgarten besonders schnell zu durchlaufen. Die andere Hälfte der Studenten erfuhr, dass ihre Ratten für besondere Dummheit gezüchtet worden waren. Obwohl die Ratten alle vom gleichen genetischen Stamm kamen, zeigten die Ratten der pseudointelligenten Gruppe deutlich bessere Leistungen als die Ratten der Kontrollgruppe. Die Studenten hatten sich einfach besser um sie gekümmert.
Der Psychologe Edward Lee Thorndike kritisierte die Studie mit den Kindern, weil die IQ-Tests nicht für jüngere Kinder geeignet seien und die Leistungen der Kinder beim logischen Denken unterdurchschnittlich gewesen sein. Die Entwicklungsprünge führte er auf die Regression zur Mitte zurück.
Historische Einordnung
Das Experiment fällt in eine Zeit, in der sehr viel über Erbe und Umwelt gestritten wurde. Heute sind fast alle Wissenschaftler von einer Gen-Umwelt-Interaktion überzeugt, die Zeit des Entweder-Oders ist vorbei. Dennoch gibt es immer noch Auseinandersetzungen zwischen Gendeterministen und Vertretern einer stärkeren Kontextüberzeugung, die sie vielfach aus der noch recht jungen Epigenetik ableiten.
Wert für die heutige Zeit
„Intelligenz ist das, was ein Intelligenztest misst“, so die heute übliche Definition. Und sie sagt alles: Es ist ein Konstrukt, mit dem wissenschaftliche Psychologen Korrelationen messen, etwa zum Führungserfolg in der bisherigen Arbeitswelt. Mehr nicht. Was Intelligenz in einer digitalisierten Arbeitswelt bedeutet, ist dabei unklar. Es scheint sich aber immer deutlicher zu zeigen, dass bisher vernachlässigte menschliche Fähigkeiten wie Empathie (wieder) an Bedeutung zunehmen werden — in dem Maße, in dem künstliche Intelligenz analytische Aufgaben übernimmt.
Die Stanford Professorin Carol Dweck, bekannt durch ihr Konstrukt des Fixed und Growth Mindset wies nach, dass allein die innere Einstellung einen (amerikanischen) Notenpunkt ausmachen kann.
5. Der Ringelmann-Effekt: Je mehr, desto fauler
Bringen Menschen in Gruppen weniger Leistung als allein? Ende des 19. Jahrhunderts experimentierte der französische Ingenieur Maximilian Ringelmann mit einem Seil und fand heraus, dass die Leistung umso mehr abnahm, je mehr Teilnehmerinnen am Seil zogen.
1974 griff der Psychologe Ingham den so benannten Ringelmann-Effekt auf. Ihre Forschungsergebnisse gingen als Lazy Co-Working oder auch soziales Faulenzen in die Psychologie-Geschichte ein.
Beim Ringelmann-Effekt war stets unklar, ob der Leistungsverlust motivations- oder koordinationsbedingt entsteht.
Daher wiederholten Allan Ingham & Kollegen das Ringelmann-Experiment und variierten die Gruppengröße. Sie verbanden den Versuchspersonen die Augen und ließen sie in Pseudogruppen am Seil ziehen. Die “Blinden” dachten dann, sie zögen mit, doch in Wirklichkeit waren sie alleine, wodurch die Leistung besonders abnahm. Koordinationsverlust ließ sich damit ausschließen. Die reduzierte Kraft der einzelnen Personen fiel mit steigender Gruppengröße immer deutlicher aus.
Historische Einordnung
In den 1970er Jahren gewann Gruppenarbeit an Bedeutung, etwa durch teilautonome Arbeitsgruppen, wie sie Toyota installierte. Seitdem nahm die Forschung zu Gruppen und Teams deutlich an Fahrt auf. Bis dahin hatte man sich stark auf größere Kollektive oder Individuen konzentriert. Der Begriff Teamarbeit entstand in dieser Zeit. Das Team ist gemeinsam auf ein Ziel fokussiert, während die Gruppe z.B. “nur” soziale Normen teilt.
Wert für die heutige Zeit
Es ist immer wieder zu beobachten, dass sich Menschen in Gruppen zurücknehmen, wenn sie den Eindruck haben, andere würden es schon richten. Vermutlich ist der Effekt vor allem dann ausgeprägt, wenn es sich um einfache Arbeiten handelt, die kein spezielles Fachwissen brauchen. Oder um Situationen, in denen man meint, andere würden bereits helfen. Die Situation prägt das Engagement in einer Gruppe stark. Dass kleine Teams besser Zusammenarbeit, ist heute allerdings unbestritten, eine optimale Teamgröße scheint bei 4,7 zu liegen, wie Studien ergaben.
Artikel Teilen:
Aktuelle Themen, die bewegen.
Sie wollen uns kennenlernen? Erleben, wie wir ticken, wer wir sind? Dann laden wir Sie herzlich ein, unsere Webinare zu besuchen, die zwei Mal im Monat stattfinden. Sie dauern jeweils 30–60 Minuten und beinhalten einen spannenden Vortrag zu einem aktuellen Thema und anschließende Diskussion. Termine geben wir ausschließlich über unseren Newsletter bekannt. Schon deshalb lohnt sich das Abo! Aber nicht nur – im Newsletter erhalten Sie erstklassige Beiträge und Erstveröffentlichungen, zudem neueste Studien.

Was möchten Sie tun?
Jetzt anmelden!
Start der Ausbildung zum Teamgestalter Gruppe Nr. 15 und der Online-Ausbildung
Jetzt anmelden für den Start Präsenz am 01.06.23 sowie Online am 13.12.2023
Sichern Sie sich jetzt einen Platz für 2023! Werden Sie Teamgestalter*in, schaffen Sie Ihre Basis für agiles Coaching, Team- bzw. Organisationsgestaltung. TeamworksPLUS® Ausbildungsgruppe Nr. 15 startet im Juni 2023, die Online-Ausbildung im Dezember. Wir sind Monate vorher ausgebucht, also sichern Sie sich Ihren Platz jetzt!
Exklusive Events, Vorträge und Webinare
Nur für Newsletter-Abonnenten
Wir bieten unserer Community spezielle Webinare und Vorträge zu aktuellen Themen. Dazu laden wir Alumni und Ausbildungsteilnehmende ein. Unser Newsletter bringt Interessenten Schnupperangebote und Termine frei Haus. Unsere exklusiven Magazin-Berichte, Tipps und Studien haben einen hohen Aktualitätsbezug und bekommen viel Lob.