Martin Nowak, österreichischer Mathematiker und Biologe, rüttelt am Konzept der „altruistischen Bestrafung“. Er sagt: Strafen schadet.
Wie entsteht Kooperation? Wieso helfen Menschen anderen Menschen, auch wenn sie das es etwas kostet? Das ist ein dauerhaft heißes Thema der mathematischen Biologie. Und ein Lieblingsthema von Martin Nowak, dem gebürtigen Klosterneuburger, der derzeit in Harvard ein „Program for Evolutionary Dynamics“ leitet. Er hält Kooperation sogar – neben Mutation und Selektion – für das dritte Grundprinzip der Evolution.
Dabei wirkt Kooperation gegen die natürliche Selektion, die die Fitness (den Fortpflanzungserfolg) mancher Individuen maximiert, aber die durchschnittliche Fitness einer Population senkt. Die Spieltheorie drückt das im „Gefangenendilemma“ aus (siehe Kasten), das auf einen Widerspruch hinausläuft: Einer Gruppe geht es besser, wenn alle kooperieren; aber jeder Einzelne kann sich durch Verweigerung des eigenen Beitrags einen Vorteil verschaffen.
Wie kann in einer solchen Situation doch Kooperation entstehen? Durch Reziprozität. Direkte Reziprozität heißt: Ich helfe dir, weil du mir geholfen hast. Wer auf diese setzt, vertraut auf das – angeblich von Zürcher Kaufleuten des 15.Jahrhunderts stammende – Prinzip „You always meet twice“.
„Ich helfe dir, weil du anderen hilfst“
Indirekte Reziprozität heißt: Ich helfe dir, weil du anderen geholfen hast. Um das zu praktizieren, muss es irgendeine Form von Ruf, von Leumund, von „record“ geben, dazu trägt die Sprache enorm bei.
Beide Formen von Reziprozität haben naturgemäß nur dann einen Sinn, wenn Erfahrungen verwertet werden können, also, in der Welt der Spieltheorie: wenn mehrere Runden gespielt werden. Von echten Versuchspersonen oder in Computersimulationen. Als Mathematiker konzentriert sich Nowak meist auf die zweite Methode, seine neue Arbeit (Nature, 452, S.348),gemeinsam mit Anna Dreber und anderen Mitarbeitern, beschreibt aber Experimente, an denen 104 Versuchspersonen teilnahmen.
Gespielt wurde eine Version des Gefangenendilemmas in mehreren Runden, etwas unorthodox (die passive Verweigerung wird durch aktives Wegnehmen ersetzt, was aber insgesamt aufs selbe hinausläuft), vor allem aber erweitert um eine Möglichkeit: Bestrafung. Ein Spieler kann kooperieren – er zahlt eine Münze, der Spielpartner bekommt zwei –, er kann dem anderen etwas wegnehmen – er bekommt eine Münze, der Partner muss eine hergeben –, oder er kann den Partner strafen. Wobei das Strafen auch den Strafenden Geld kostet: Er zahlt eine Münze, der Bestrafte zahlt vier. Man nennt das „altruistisches Strafen“, denn es bringt dem Strafenden keinen Vorteil, sondern individuell sogar einen Nachteil: Er straft sozusagen zum Wohl der Gruppe, der allgemeinen Moral.
„Extrem positive Botschaft“
Dieses altruistische Strafen ist seit einigen Jahren in Mode in der Spieltheorie. Martin Nowak aber zweifelt schon länger an seiner Bedeutung für die Etablierung von Kooperation. Die neue Arbeit scheint ihm Recht zu geben. In den Spielen, in denen Bestrafung möglich war, wurde zwar mehr kooperiert als in einem Setting ohne Strafen, aber der durchschnittliche Gewinn in der Gruppe war größer. Mehr noch: Die Spieler, die am meisten Gewinn einstreiften, waren jene, die wenig oder gar nicht straften. Gewinner verwenden eher eine „Tit-for-tat“-Strategie: Sie antworten auf Kooperation mit Kooperation, auf unfreundliche Akte mit unfreundlichen Akten. „Winners don't punish“, fassen die Autoren zusammen: Bestrafung sei kein effektives Mittel, um Kooperation zu fördern. Die Neigung der Menschen, andere zu bestrafen, sei in der Evolution aus anderen Gründen entstanden, z.B. um Dominanzhierarchien zu etablieren oder Besitz zu verteidigen. „Unser Ergebnis hat eine sehr positive Botschaft“, sagt Nowak: „In einer extrem kompetitiven Situation sind jene die Gewinner, die der Versuchung widerstehen, Konflikte eskalieren zu lassen.“
„Eine sehr wichtige Arbeit“, kommentiert der Wiener Mathematiker Karl Sigmund, der mit Nowak lange kooperiert hat, „besonders nach dem Hochjubeln des ,altruistic punishment‘. Das wurde von manchen ja schon als einziger Schlüssel zur Kooperation dargestellt.“ Durch die Versuchsanordnung – immer nur zwei spielen miteinander, keiner weiß, wie sich der Partner in früheren Spielen verhalten hat – werde aber ein Effekt des Strafens nicht beachtet: Der Strafende erwirbt sich eine Reputation. „Normalerweise wissen die Leute viel mehr übereinander“, meint Sigmund: „Wenn alle wissen, da ist einer, der rastet aus und bestraft emotional, mit dem ist nicht gut Kirschen essen, dann wird das Auswirkungen haben. Ich würde sagen: Wenn man bestraft, dann so, dass auch andere etwas davon mitbekommen.“
GEFANGENENDILEMMA
Originalversion: Zwei Gefangene werden verdächtigt, gemeinsam einen Einbruch begangen zu haben. Wenn einer gesteht, kommt er straffrei davon, sein Partner wird zu fünf Jahren Haft verurteilt. Wenn beide schweigen – also kooperieren –, bekommen sie beide zwei Jahre. Wenn beide gestehen – also nicht kooperieren –, werden beide zu vier Jahren verurteilt. Insgesamt wäre es die beste Lösung, wenn beide schweigen. Einseitiger Verrat allerdings bringt dem Verräter einen Vorteil.
("Die Presse", Print-Ausgabe, 20.03.2008)