Читать книгу Страсти в нашем разуме. Стратегическая роль эмоций - Роберт Фрэнк - Страница 17
II. Парадокс альтруизма
«Око за око» и дилемма заключенного
ОглавлениеКак мы видели в главе I, погоня за эгоистическим интересом часто сбивает людей с толку. Во многих ситуациях мы можем достичь того, к чему стремимся, только если каждый из нас отставит в сторону личный интерес. В периоды жары в Нью-Йорке энергетическая компания Consolidated Edison Company предупреждает жителей, что им будет достаточно электричества на первостепенные нужды, если они не станут включать кондиционеры до десяти вечера. Многие потребители легко согласились бы подождать с кондиционером до вечера, лишь бы не было отключения электричества. Но страх, что другие не станут соблюдать свою часть сделки, подрывает многие из подобных попыток кооперации. Как только кто-то заслышит, что у соседа в семь вечера заработал кондиционер, договоренность моментально теряет силу.
Такого рода дилеммы долгое время являются излюбленной темой бихевиористов и теоретиков игр. Самый обсуждаемый пример – дилемма заключенного. Заслуга в открытии этой простой игры приписывается математику А.У. Такеру, взявшему ее название из анекдота, который вначале ее иллюстрировал. Двоих заключенных держат в разных камерах за серьезное преступление, которое они совершили. Однако имеющиеся у обвинения доказательства позволяют вынести им приговор только за небольшое правонарушение, которое карается, скажем, годом тюремного заключения. Каждому из заключенных говорят, что, если он признается, а другой промолчит, признавшийся выйдет на свободу, тогда как его подельник проведет 20 лет в тюрьме. Если признаются оба, они получат промежуточный срок, скажем, пять лет. (Эти выигрыши приводятся в табл. II.1.) Заключенным не разрешается общаться друг с другом.
Превалирующая в дилемме заключенного стратегия – признаваться. Независимо от того, что делает Y, Х получает более мягкий приговор, если заговорит: если Y тоже признается, Х получит пять лет вместо 20; если Y так и будет молчать, Х выйдет на свободу вместо того, чтобы год сидеть в тюрьме. Выигрыши идеально симметричны, так что Y тоже лучше признаться вне зависимости от того, что делает Х. Трудность здесь опять-таки заключается в том, что, если каждый будет вести себя эгоистически, обоим будет хуже, чем если каждый проявит сдержанность. Таким образом, когда оба признаются, они получают пять лет вместо одного года, который могли бы отсидеть, если бы промолчали.
Хотя заключенным не позволяется общаться друг с другом, было бы ошибкой считать, что источник затруднений именно в этом. Скорее, их проблема в нехватке доверия. Простое обещание не признаваться не меняет материальных выигрышей игры. (Если бы каждый мог пообещать, что не признается, все равно каждому было бы лучше, если бы он не сдержал обещание.)
Таблица II.1. Дилемма заключенного
В одном давнем исследовании Анатоль Рапопорт и Альберт Чаммах выясняли, как на самом деле ведут себя люди, перед которыми неоднократно вставала дилемма заключенного[23]. В их экспериментах, как и в сотнях других, последовавших за ними, парам игроков давалось два варианта выбора: «сотрудничать» или «отказаться от сотрудничества». В качестве выигрыша выступали небольшие суммы денег, а не годы тюремного заключения, но в остальном структура игры была идентична дилемме заключенного. Типичная игра представлена в табл. II.2.
Таблица II.2. Дилемма заключенного с денежными вознаграждениями
Как и раньше, превалирующая стратегия для идентичной игры – не сотрудничать. Это приносит более высокий выигрыш независимо от того, как поступает второй игрок. Однако, как и в изначальной дилемме заключенного, каждому игроку будет лучше, если оба будут сотрудничать, чем если оба переметнутся.
Главное открытие Рапопорта и Чаммаха было в том, что люди демонстрируют сильную тенденцию к сотрудничеству, когда многократно играют с одним и тем же партнером. Причина проста. Если игра происходит много раз, у сотрудничающего есть возможность расквитаться с партнером, который его предал. Как только становится понятно, что за это придется расплачиваться, обе стороны обычно сходятся на модели сотрудничества. Рапопорт и Чаммах назвали стратегию, вознаграждающую сотрудничество и наказывающую переметнувшегося, «око за око».
В недавней книге Роберт Аксельрод исследует вопрос, как стратегия «око за око» работает на фоне широкого ряда хитроумных контрстратегий[24]. Стратегия «око за око» формально определяется как «первый ход – сотрудничать, каждый последующий ход – повторять предшествующий ход другого игрока». Это «хорошая» стратегия в том смысле, что она показывает изначальную склонность к сотрудничеству. Но это также и жесткая стратегия: она быстро наказывает другую сторону, как только та предаст. Если каждый из игроков играет «око за око», результат – идеальное сотрудничество в каждом раунде игры. Таким образом, пара игроков, применяющих стратегию «око за око», получает самый большой совокупный выигрыш.
Аксельрод изучал гипотетические популяции игроков. В популяциях были представлены не только стратегия «око за око», но также и многочисленные другие стратегии. Он выполнил компьютерные симуляции, чтобы понять, какие условия способствуют появлению сотрудничества. И открыл, что стратегия «око за око» действовала очень хорошо в сравнении с рядом циничных стратегий, которые были специально разработаны для того, чтобы нанести ей поражение.
В схеме Аксельрода появление сотрудничества требует, чтобы был достаточно стабильный состав игроков, каждый из которых может вспомнить, что делали другие игроки в предшествующих взаимодействиях. Оно также требует, чтобы игроки делали серьезную ставку на то, что произойдет в будущем, ибо только страх расплаты удерживает людей от того, чтобы отказаться от сотрудничества. Когда эти условия выполнены, сотрудничающие могут распознать друг друга и исключить тех, кто склонен к предательству[25]. Чем выше выигрыши, заложенные в успешном сотрудничестве, тем больше доля популяции, готовая сотрудничать.
Условия, необходимые для модели «око за око», часто выполняются в человеческих популяциях. Многие люди и в самом деле взаимодействуют многократно, и большинство следит за тем, как другие с ними обращаются. Аксельрод собрал убедительные свидетельства, что эти факторы помогают объяснить, как в действительности ведут себя люди. Возможно, самое убедительное подтверждение – рассказы о системе «живи сам и дай жить другим», сложившейся в окопах во время Первой мировой войны. Во многих местах боевых действий одни и те же воинские подразделения вели окопную войну друг против друга на протяжении нескольких лет. Часто они были подобраны в соответствии друг с другом, так, чтобы ни у кого не было надежды на быструю победу. Перед ними стоял выбор: либо интенсивно сражаться с большими потерями с обеих сторон, либо практиковать сдерживание.
Условия взаимодействия, описанные в рассказе историка Тони Эшворта об окопной войне, очень похожи на те, что необходимы для успеха стратегии «око за око»[26]. Идентичности игроков были более или менее стабильны. Взаимодействия между ними повторялись, часто по нескольку раз в день в течение продолжительных периодов времени. Каждая сторона могла легко сказать, когда другая сторона отказалась от сотрудничества. И каждая сторона очевидным образом была заинтересована свести будущие убытки к минимуму.
Можно не сомневаться, что стратегии «око за око» часто отдавали предпочтение воинские части и союзников, и немцев. Хотя официальная политика крайне отрицательно относилась к сдерживанию, порой оно было более чем очевидно. Так, касательно ночных патрулей, действовавших в окопах, Эшворт пишет:
И Британия, и Германия в тихих секторах предполагали, что, если вдруг патрули случайно столкнутся, ни один не будет ввязываться в бой, но все будут стараться избегать друг друга. Все патрули давали друг другу передохнуть тогда, когда агрессия была не только возможна, но предписана правилами, с условием, что на этот жест ответят тем же, поэтому, если один патруль откроет огонь, второй тоже будет стрелять[27].
По словам одного из участников конфликта:
Обойдя какой-то ров или яму, мы внезапно очутились лицом к лицу с немецким патрулем… Мы были, может быть, в двадцати ярдах друг от друга, полностью на виду. Я робко помахал рукой, как будто говоря, какой нам толк убивать друг друга? Немецкий офицер, казалось, понял меня, и обе стороны развернулись и отправились обратно в свои окопы[28].
Часто бомбардировки происходили в определенное время суток и были отдалены от наиболее уязвимого времени и позиций. Время приема пищи и санитарные палатки обычно, по молчаливому соглашению, исключались из зоны и времени обстрелов.
Условия, описанные Аксельродом, помогают объяснить не только то, когда люди будут сотрудничать, но также – когда они скорее всего будут воздерживаться от сотрудничества. Так, он отмечает, что взаимное сдерживание в окопной войне начало прекращаться, как только забрезжил конец войны.
То же самое происходит и в мире бизнеса. Компании платят по счетам вовремя, указывает Аксельрод, не потому, что так правильно поступать, но потому что им и в будущем придется иметь дело с теми же поставщиками. Когда взаимодействия в будущем представляются маловероятными, тенденция к сотрудничеству идет на спад: «Примером может послужить ситуация, когда предприятие стоит на грани банкротства и продает свою дебиторскую задолженность сторонней организации, называющейся “фактором”». Продажа идет с существенной скидкой, потому что
‹…› как только производитель начинает идти ко дну, даже лучшие его клиенты отказываются оплачивать товар, ссылаясь на дефекты качества, несоответствие спецификациям, несоблюдение сроков поставки, на все что угодно. Великий проводник морали в коммерции – постоянство отношений, вера в то, что может снова понадобиться вести дела с этим клиентом или с этим поставщиком, и когда компания-банкрот теряет этого проводника, даже мощный фактор не в состоянии найти ему замену[29].
От всего этого несвободен даже академический мир: «с приглашенным профессором будут обращаться хуже, чем с постоянными коллегами»[30].
Невозможно поспорить с тем, что доверие и сотрудничество часто возникают по причинам, указанным данными авторами. Материальный мир – сложная среда, и наказанием за некритическое альтруистическое поведение часто становится невозможность выживания.
Но опять-таки с точки зрения наших целей трудность в том, что «око за око» – попросту не настоящее альтруистическое поведение. Скорее, подобно взаимному альтруизму, это яркий пример осмотрительного поведения – просвещенной осмотрительности, но тем не менее поведения эгоистического. Человек, который сотрудничает только при условиях, описанных в этих теориях, едва ли может претендовать на высокую нравственность. Те, кто ищет более глубокие, более благородные побуждения в людях, должны искать их где-то в другом месте.
23
Rapoport A., Chammah A. Prisoner’s Dilemma. Ann Arbor: University of Michigan Press, 1965.
24
Axelrod R. The Evolution of Cooperation. N.Y.: Basic Books, 1984.
25
Строго говоря, появление сотрудничества в схеме Аксельрода также требует, чтобы игроки не знали наверняка, сколько раз они будут взаимодействовать друг с другом. Если, например, они знали бы, что будут играть друг с другом ровно 100 раз, каждый игрок знал бы, что во время сотой, или последней, игры эгоистическая стратегия состояла бы в том, чтобы не сотрудничать, потому что тогда уже противник не сможет с ним поквитаться. Но это означало бы также, что не могло быть действенной угрозы расплаты и во время 99-й игры, что в свою очередь означало бы, что тогда тоже лучше всего было бы переметнуться. Поскольку тот же самый аргумент на каждом шаге приложим к каждому взаимодействию, решение «око за око» перестает работать. См.: Kreps D.M., Milgrom P., Roberts J., Wilson R. Rational Cooperation in Finitely Repeated Prisoner’s Dilemma // Journal of Economic Theory. 1982. Vol. 27. P. 245–252, где утверждается, что кооперативная игра тем не менее может быть рациональной в этих обстоятельствах, если есть некоторая вероятность, что другие будут иррационально следовать стратегии «око за око».
26
Ashworth T. Trench Warfare, 1914–18: The Live and Let Live System. N.Y.: Holmes and Meier, 1980.
27
Ibid. Р. 103.
28
Цит. по: Ashworth T. Trench Warfare… Р. 104.
29
Цит. по: Axelrod R. The Evolution of Cooperation. Р. 59–60.
30
Ibid. Р. 60.