Среди современных теорий научения те теории, которые уделяют особое внимание подкреплению или закону эффекта, преуменьшают перцептивные факторы, часто критикуемые как «умозрительные» и неудобные для выражения их в физических терминах. В то же время теории, придающие особое значение перцептивному научению, склонны отрицать непосредственную важность фактора подкрепления. Однако нет очевидной несовместимости этих двух факторов, и тезисом данного сообщения является, что оба они существенны в любом процессе научения.
Понятие восприятия не вляется обязательно умозрительным (осознаваемым). Перцептивная функция есть дальнейшее развитие рецептивного процесса, приспосабливающего организм к объективной ситуации, а не только к воспринимаемым стимулам. Чтобы избежать интроспективного оттенка слова «воспринимать», я иногда заменяю его словом «регистрировать» [4]. Фотографическая пластинка регистрирует стимулы, а не объекты, но в принципе возможно сконструировать физико-химический аппарат, который регистрировал бы такие объективные факторы, как направление звука или расстояния, размер или отражательная способность (альбедо) видимого объекта. Правда, для того чтобы зарегистрировать все эти факты одновременно и в отношении друг к другу, как это делается организмами человека и животного, потребовалась бы чрезвычайно сложная аппаратура. Но регистрацию объективных факторов как ответ на признаки или стимулы не следует считать процессом в меньшей степени физическим, чем координация мышечных движений. Слово «регистрировать» допускает количественный подход. Факт может быть зарегистрирован в большей или меньшей степени, и регистрация факта может быть усилена подкрепляющими факторами. Текущая регистрация происходит постоянно и меняется с каждым изменением окружающей обстановки, но для относительно стойкой регистрации, которую мы называем научением и запоминанием, необходимо некоторое подкрепление.
Когда Павлов заимствовал слово reinforcement1 у других физиологов, он имел в виду сохранить его буквальное значение. Коленный рефлекс буквально подкрепляется или усиливается сжиманием кулака или громким звуком непосредственно перед ударом по пателлярному сухожилию. Поскольку за условной слюнной реакцией следует более сильный безусловный ответ, Павлов говорил в свое время, что первое подкрепляется вторым. Он мог говорить так, пока сосредоточивал свое внимание на количестве измеряемой им слюны, а не на моторных компонентах полного условного пищевого ответа — настораживании ушей, повороте головы в направлении звонка, приближении к кормушке и других предваряющих движениях [5]. Все это не усиливается подачей еды, а, наоборот, сразу уступает место совершенно другим движениям — жеванию и проглатыванию. Даже усиленное слюноотделение относится к натуральному рефлексу на пищу во рту, а не в буквальном смысле является усилением условной реакции.
Это последнее утверждение становится более понятным в случае условной мигательной реакции. Здесь условной реакцией является сравнительно медленное сокращение кольцевых мышц, управляемое корой мозга, в то время как мигательный рефлекс является значительно более быстрым и коротким сокращением тех же самых мышц, управляемых субкортикальным механизмом. Будучи действительно подкрепленной, условная мигательная реакция должна была бы стать более продолжительной, чем мигательный рефлекс, но подобный эффект в литературе неизвестен. В действительности самая сильная условная реакция получается путем смены безусловного раздражителя, как это имеет место в первой пробе в серии на угашение. Напротив, закономерно следующий безусловный раздражитель тормозит условную реакцию или приводит к ее быстрому окончанию. В результате приходится сделать вывод о том, что безусловный раздражитель и реакция не подкрепляют условную реакцию в сколько-нибудь буквальном смысле этого слова.
Смысл, в котором психологи употребляют слово «подкрепление», никогда и не был буквальным. Иногда они используют это слово в чисто операциональном смысле, например когда экспериментатор сообщает, что он «дал» субъекту двадцать подкреплений перед тем, как начала появляться реакция. Очевидно, что экспериментатор не дает подкреплений в готовом виде; он предъявляет необходимые раздражители, а подкрепление представляет собой некий реактивный процесс, происходящий в субъекте.
Гораздо чаще психологи говорят о подкреплении как об усилении связи между условным раздражителем и условной реакцией. Эта связь, будучи неявной в данный момент, обнаруживается в последующих пробах в увеличении силы или частоты условной реакции. Однако очень неплохо, если бы мы могли указать на что-то, что действительно усиливается и буквально подкрепляется в тот самый момент, когда происходит подкрепление.
Тот факт, что условная реакция начинает вырабатываться только после ряда подкреплений и наверняка не в первой пробе, является еще одним аргументом против предположения, что подкрепление действует главным образом на условную реакцию или на связь УС—УР (условный стимул — условная реакция). В первых пробах условная реакция отсутствует — как же в таком случае она может быть подкреплена? Связь УС—УР еще не образована — как же в таком случае она может быть усилена? Можно предположить, что подкрепление и образование условной связи происходит не в начале, а только после некоторого количества проб. Исходя из этого, мы могли бы дать экспериментатору весьма практический совет: в интересах экономии просто опустить первые двадцать проб, в которых ничего не происходит, и начать серию с двадцать первой пробы! Очевидно, мы вынуждены считать, что подкрепление действует на что-то в ранних пробах и что образование условной связи находится на достаточно поздней стадии, когда начинает появляться условная реакция. Итак, остается вопрос: что же на самом деле подкрепляется во время этих ранних проб?
Мы можем сказать, что с самого начала подкрепляется ожидание. В первой пробе звонок вызвал то, что Павлов в назвал «исследовательским рефлексом» — особый вид вопроса, неопределенной готовности к чему-то, что должно еще случиться. Появление пищи не усиливает в точном смысле это ожидание, напротив, ожидание уступает место новой активности. Однако мы можем сказать, что пища придает форму ожиданию и делает его все более и более определенным в последующих пробах. Эта определённость ожидания и подкрепляется.
Теперь определенное ожидание есть нечто большее, чем только субъективное состояние. Оно относится к объектам, к последовательности событий: звонок — еда. Его лучше характеризовать не только как ожидание, а как восприятие или регистрацию последовательности событий. В первой пробе звук имеет неопределенный сигнальный характер, он звучит так, как будто что-то еще может произойти. Когда вслед за тем появляется пища, этот сигнальный характер усиливается и получает определенную форму, так что во второй пробе звук уже начал приобретать свойства условного раздражителя, он звучит уже более как сигнал, и эта сигнальность регистрируется еще сильнее, когда снова появляется пища. Идея, которую я отстаиваю, состоит в том, что, начиная уже с первой пробы, в организме присутствует нечто такое, что может быть подкреплено, и оно принадлежит к рецептивной, не эфферентной части общего поведения организма. Слово «регистрация» больше соответствует описанию этих фактов, чем «восприятие»: по крайней мере человек должен воспринимать последовательность событий очень быстро, в то время как может понадобиться много проб для такого закрепления последовательности, которое обеспечивало бы соответствующую моторную и секреторную реакцию.
Что касается связей, то некоторые из них могут быть образованы уже до выработки условной реакции, но основная связь соединяет условный стимул со смыслом, который он приобретает как первое событие в закономерной последовательности.
В эксперименте по выработке условной связи субъект не должен выучиваться слюноотделению или миганию. То, что выучивается («обусловливается»), является по природе сенсорным, а не моторным. Изменение, которое происходит в процессе выработки условной связи, есть изменение в способе получения или восприятия последовательности стимулов и в особенности предварительного или условного стимула.
В экспериментах, которые содержат альтернативы и требование выбора, то, что должно быть выучено, есть различие между стимулами-объектами, а не между моторными реакциями. Хорошо известны поисковые движения, которые производит мышь в пункте раздвоения лабиринта, выбирая тот или иной путь; они существенно одинаковы, независимо от того, какой путь в результате предпочитается [3]. То, что должно быть выучено, есть различие между двумя ходами; их различная локализация может быть мгновенно воспринята крысой. Затем один из путей, будучи пройденным и исследованным, определяется как имеющий тупик, и этот характер тупика регистрируется, хотя, может быть, и очень слабо. Когда путь снова пройден и снова исследован во второй пробе, эта регистрация подкрепляется повторным обнаружением тупика. Точно таким же образом обнаруживается и подкрепляется другой, открытый и ведущий к цели путь, хотя подкрепление вполне может быть сильнее, чем в случае тупика, из-за сильного стремления достичь кормушки. Однако принцип подкрепления приложим в равной мере и к тупику, и к открытому маршруту.
Имеются два основных выражения относительно того, что подкрепление играет роль в перцептивном научении. Согласно одному из них подкрепление приходит слишком поздно, чтобы повлиять на соответствующее восприятие. За впечатлениями, полученными у входа в тупиковый конец, следует обнаружение тупика лишь спустя некоторое время — как же тогда это обнаружение может изменить или усилить (подкрепить) первые впечатления? Данное возражение не учитывает объема времени при исследовании идентифицируемого объекта. Если крыса вначале воспринимает вход в лабиринт и затем исследует его, то данная часть лабиринта остается для нее той же самой, и тупик, будучи обнаружен, регистрируется как относящийся к тому пути, который воспринимался у входа. Конечно, когда подкрепление происходит только после того, как пройдено значительное расстояние и затрачено либо большое количество времени, либо большое количество движений, подкрепление может почти не иметь успеха и научение происходит очень медленно. Однако следует учитывать определенную временную протяженность всякий раз, когда происходит обследование объекта или последовательности событий.
Другое возражение состоит в том, что восприятие само по себе не является мотивированным процессом, имеющим цель; оно не может подкрепляться, поскольку подкрепление связано с Достижением цели. Восприятие представляется пассивным процессом. Для наивного наблюдателя то, что он видит, определяется находящимся перед ним и больше ничем. Для психологов различных школ восприятие обусловлено перцептивными навыками, сформированными в прошлом опыте, или организующими силами, действующими в стимульном поле. Признаются некоторые скрытые мотивы, такие, как, например, потребность найти путь к цели, или желание увидеть красивое, или даже желание собирать цветы, или сохранять собственные предрассудки. Настоящий тезис в противоположность этой обычной точке зрения заключается в том, что восприятие всегда побуждается непосредственным, присущим данной ситуации мотивом, который можно назвать желанием воспринимать. Какой бы скрытый мотив ни появлялся время от времени, этот непосредственный перцептивный мотив всегда присутствует при любом функционировании органов чувдтв. Невозможно смотреть без попытки увидеть или слушать без попытки услышать. Видеть, слышать, видеть ясно, слышать отчетливо, каждый раз выяснять, что видится или слышится,— эти конкретные, непосредственные мотивы доминируют во взаимоотношении с окружающей средой.
Непосредственной целью движений глаза при фиксации, аккомодации и конвергенции является достижение ясного слитного, стереоскопического образа. Когда человек привыкает к новой паре очков, ясное видение, будучи достигнутым, подкрепляет необходимую настройку глаз. Точно такими же активными, как эти реакции глазных мышц, являются центральные процессы, участвующие в нахождении замаскированной фигуры или фигуры в кажущемся беспорядочном нагромождении пятен [1; 2]. Когда цель подобных поисков достигнута, сильное подкрепление обнаруживается во вскрике удовлетворения наблюдателя, а позже — в отличном удержании найденной фигуры. Я уверен, что когда солдат обнаруживает в искусной вражеской маскировке пушку или автомобиль, он испытывает сильнейшее подкрепление и обучается этому восприятию в единственной пробе. Можно сослаться на примеры сложных или незнакомых стимулов, которые вначале воспринимаются неудовлетворительно, а затем правильно, так как приобретают смысл и оказываются включенными в хорошо известную ситуацию.
Хорошо натренированное восприятие обычных ситуаций происходит настолько быстро и уверенно, что отдельные фазы проверки и подкрепления не могут быть обнаружены. Такие случаи восприятия и создают ошибочное впечатление их чистой пассивности. Когда же совершается новый перцептивный акт — например, когда расшифровывается неясный стимуль-ный комплекс или раскрывается значение признака или знака, наблюдается элементарный двухфазный процесс. Это процесс: проба-и-проверка. Фаза пробы есть попытка прочесть сигнал, распутать неясное, охарактеризовать объект; фаза же проверки есть принятие или отказ, позитивное или негативное подкрепление попытки восприятия. Эксперимент по выработке условной связи, действительно, имеет дело с образованием нового восприятия, и он ясно выявляет фазу подкрепления, несмотря на то что не обнаруживает полную эффективность сильного и непосредственного подкрепления, такого, которое формирует восприятие в единственной пробе.
Литература
1. Hanawalt N. G. The effect of practice upon the perception of simple designs masked by more complex designs. J. Exper. Psychol., 31, 134—148, 1942.
2. beeper R. A study of neglected portion of the field of learning; the development of sensory organization. J. Genet. Psychol. , 46, 41—75, 1935.
3. Tolman E. C, Ritchie B. F., Kalish D. Studies in spatial learning. II Place learning versus response learning. J. Exper. Psychol., 36, 211—229, 1946.
4. Woodworth R S. Adjustment and Mastery, 1933, 40—55.
5. Zener К. E. The significance of behavior accompanying conditioned salivary secretion for theories of the conditioned response. Amer. J. Psychol., v. 50, 1937, pp. 384—403.
Автор: P. С. Вудвортс