Читать книгу Не рычите на собаку! Книга о дрессировке людей, животных и самого себя - Карен Прайор - Страница 6
1. Подкрепление: Лучше чем вознаграждение
Отрицательное подкрепление
ОглавлениеИтак, подкрепление – это то, что повышает вероятность повторения поведения. Но подкреплением вовсе не обязательно должно быть то, чего ученик хочет. Избегание неприятного тоже может быть подкреплением. Лабораторные исследования показывают, что поведение можно закрепить с помощью стимулов, вызывающих отрицательную реакцию, если изменение поведения приводит к устранению этих стимулов. Подобные стимулы называются отрицательными подкреплениями. Это то, чего человек или животное стремится избежать.
Отрицательные подкрепления могут состоять из самых слабых раздражителей (стимулов) – неодобрительный взгляд друга, когда вы неудачно пошутили, легкий ветерок от кондиционера, который заставил вас пересесть на другой стул. Однако отрицательными подкреплениями могут служить и самые экстремальные раздражители – от публичного унижения до электрошока. Они же являются и наказанием. Когда на нас кричат, мы воспринимаем это как наказание. Но мы быстро учимся имитировать работу, когда начальник, который часто кричит на нас, появляется у входной двери.
Отрицательное подкрепление – это стимулы, которых можно избежать путем изменения поведения.
Как только возникает новый стандарт поведения, раздражитель исчезает, и новое поведение закрепляется. Предположим, что в гостях у тетушки я собралась положить ноги на журнальный столик, как дома. Тетушка неодобрительно поднимает брови. Я опускаю ноги на пол. Она расслабляется. Я тоже чувствую себя гораздо спокойнее.
Поднятые брови – это стимул, который действует как отрицательное подкрепление. Поскольку я была в состоянии избежать этого стимула, новое поведение – привычка держать ноги на полу – будет повторяться вновь, по крайней мере, в доме тетушки, но, возможно, и в других домах тоже.
Тренинг может основываться почти исключительно на отрицательном подкреплении, и зачастую дрессировка животных проводится именно так. Лошадь учат поворачивать налево, резко дергая левый повод. Когда лошадь поворачивает, неприятное давление во рту ослабевает. Лев поднимается на тумбу и остается на ней, чтобы оказаться подальше от хлыста дрессировщика.
Однако отрицательное подкрепление – это вовсе не то же самое, что наказание. В чем же разница? В первом издании этой книги я написала, что наказание – это воздействие, которое возникает после проявления поведения, нуждающегося в изменении, и, следовательно, не оказывает влияния на поведение. «Мальчик, которого отшлепали за плохие оценки в дневнике, может улучшить или не улучшить свои оценки, но он просто не в состоянии изменить те, что уже в дневнике проставлены». И действительно, когда мы сознательно наказываем кого-либо, то чаще всего делаем это слишком поздно. Но не в этом заключается основное различие между наказанием и отрицательным подкреплением.
Современные психологи-бихевиористы называют наказанием любое событие, которое прекращает поведение. Ребенок засунул шпильку в электрическую розетку. Мать хватает его и/или шлепает по руке: поведение, которое угрожает жизни, необходимо прервать немедленно. Поведение прекращается. В этот момент может начаться что-то другое – ребенок заплачет, мать расстроится и т. п., – но опасная привычка совать что попало в электрическую розетку, будет устранена, по крайней мере, в данный момент.
Б. Ф. Скиннер более точен в этом отношении. Он определяет наказание как нечто, что происходит, когда поведение приводит к утрате чего-либо желанного – удовольствия узнать, что произойдет, если засунуть шпильку в розетку, весьма характерного для детей, – или когда поведение приводит к каким-то нежелательным последствиям. Однако в обоих случаях, когда данное поведение прекращается, невозможно предсказать, повторится ли оно в будущем.
Мы знаем, что положительное подкрепление повышает вероятность желательного поведения в будущем, но наказание не приводит к предсказуемым результатам.
Например, схватив ребенка или шлепнув его по руке даже в самое подходящее время, может ли мать быть уверена в том, что он не попытается засунуть ту же шпильку в ту же розетку в другое время? Я в этом очень сомневаюсь. Спросите у любого родителя. Все мы стараемся спрятать мелкие предметы, закрыть розетки, передвинуть мебель, пока ребенок не вырастет.
Отрицательное подкрепление можно эффективно использовать для воспитания желательного поведения. При этом даже при наличии негативных стимулов процесс может быть относительно доброжелательным. Благодаря любезности специалиста по ламам Джима Логана, я могу привести прекрасный пример использования отрицательного подкрепления при дрессировке полудомашних лам, которых в США содержат как домашних животных, а во всем мире – ради ценной шерсти.
Ламы – животные пугливые и застенчивые. В этом они похожи на лошадей. Если их не воспитывать с раннего детства, приручить их очень трудно. Хотя обучение с помощью пищевого подкрепления великолепно подходит для лам, в тех случаях, когда животное слишком пугливо, чтобы подойти и взять у человека пищу, современные дрессировщики поступают следующим образом. Они используют кликер. Этот сигнал говорит ламе, что ее поступок заслужил подкрепление, но основное, реальное подкрепление заключается в устранении отрицательного подкрепления.
Это все равно, что сказать ламе: «Ты будешь стоять на месте, если я подойду к тебе на 30 футов? Да? Хорошо. Я щелкну моим кликером, повернусь и отойду.
А теперь ты будешь стоять на месте, если я подойду к тебе на 25 футов? Да? Хорошо. Я кликну и отойду».
Использование кликера для концентрации внимания на привычке стоять спокойно, когда страшный человек поворачивается и уходит, действует как положительное подкрепление. Такой прием позволяет сократить дистанцию между животным и человеком до минимальной величины всего за пять или десять минут. В этой ситуации все контролирует лама. Она стоит спокойно – и это заставляет человека отступить! Поэтому животное продолжает стоять спокойно, даже когда человек подходит прямо к нему.
Когда человек несколько раз касается ламы и тут же отступает, лед тает. Человек больше не кажется животному страшным. И вот тут-то наступает время корзинки с пищей. Коммуникативная петля выглядит следующим образом: «Могу я коснуться тебя, пока ты стоишь спокойно? Да? Клик – и вот вкусная, замечательная пища». Лама стремится получить положительное подкрепление, то есть пищу, поглаживание и ласку. Она понимает, что для этого нужно демонстрировать новое поведение – стоять спокойно вместо того, чтобы убегать сломя голову.
Такое использование отступления при проявлении желательного поведения является важным аспектом работы так называемых «заклинателей». При использовании подобного метода дрессировщик работает со свободной лошадью в ограниченном пространстве и за относительно короткое время превращает настоящую дикарку в лошадь, спокойно относящуюся к человеку. Совершенно дикая лошадь успокаивается настолько, что смиряется с седлом и наездником. Подобное мастерство может показаться настоящей магией.
Дрессировщики, использующие такие приемы, часто объясняют происходящее сверхъестественной силой. Хотя многие используют определенный звук или движение в качестве сигнала-маркера, или условного подкрепления, мало кто понимает, что именно он делает. Тем не менее в этой работе нет ничего магического. Это законы оперантного обусловливания в действии.
Хотя отрицательное подкрепление – довольно полезный процесс, очень важно помнить, что любое подобное действие несет в себе элемент наказания. Когда вы тянете за левый повод, пока лошадь не повернет, вы наказываете животное заранее. Чрезмерное увлечение отрицательными подкреплениями может привести к тому, что Мюррей Сидмен называет «осадком», то есть к нежелательному побочному действию.