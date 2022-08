Seit dem Welterfolg des Buchs „Nudging“ von 2008 setzen Regierungen in aller Welt auf die „sanfte“ Steuerung von Bürgern durch psychologische Tricks. Eine Metastudie wollte die Wirksamkeit der Maßnahmen nachweisen – und wird nun in drei Repliken heftig kritisiert.

Wie bringt man die Österreicher dazu, beim Gas zu sparen, damit wir über den Winter kommen, Putin zum Trotz? Die Regierung könnte rationieren, Heizen zusätzlich verteuern, hohen Verbrauch bestrafen. Damit würde sie sich verdammt unbeliebt machen. Man könnte aber auch jedem Haushalt einen Brief schicken, in dem man über den Verbrauch der Meiers und Müllers von nebenan informiert. Dann würden sich manche an sparsamen Nachbarn orientieren: Die kommen mit so wenig Gas aus? Das schaffen wir auch! Solch sanfte Steuerung, die mit psychologischen Tricks arbeitet, wird von Verhaltensökonomen unter dem Schlagwort „Nudging“ (Stupsen, Anstoßen) angepriesen, seit dem Riesenerfolg des gleichnamigen Buchs von 2008. Politiker haben die Empfehlung begierig aufgegriffen – über 200 staatliche Nudging-Stabstellen gibt es heute weltweit. Aber bei vielen Projekten blieb der Erfolg aus, manchmal ging der Schuss sogar nach hinten los.

Um Klarheit zu schaffen, werteten Ende des Vorjahrs vier Psychologen der Uni Genf über 200 Studien mit 440 Fallbeispielen aus (Pnas, 30. 12. 21). Sie gaben Entwarnung: Im Schnitt funktionierten „Eingriffe in die Entscheidungsarchitektur“, wie das Nudging korrekt heißt, recht gut, auf gleichem mittleren Niveau wie klassische Maßnahmen, die politisch viel schwerer durchzusetzen sind.

Aber nun wird ihre Arbeit im gleichen Journal scharf kritisiert, in drei Repliken von insgesamt 17 Kollegen aus den USA, Großbritannien und Ungarn (Pnas, 19. 7.). Die statistischen Kontrollen bei der Metastudie seien unzureichend, und richtig hinterfragt ergebe sich etwas ganz anderes: Nudging ist üblicherweise nahezu wirkungslos und funktioniert nur in Ausnahmefällen. Die Maßgröße, um die es geht, heißt „Cohens d“. Bei einer völlig erfolglosen Maßnahme ist dieses d null, bei einer sehr erfolgreichen liegt es zwischen 0,8 und eins. Der ermittelte Durchschnitt von 0,43 wäre zwar ausreichend gut. Aber, erster Einwand: Die Bandbreite ist gewaltig, die Werte streuen von negativ (also kontraproduktiv) bis nahe eins.

Schlechte Ergebnisse nicht publiziert