ЗРИТЕЛЬНОЕ ВНИМАНИЕ:
управление, репрезентивная основа отбора и временной ход
Хауард Эджет, Стивен Янтис
Перевод В.И. Ерёменко под ред. М.В. Фаликман
Содержание
В обзоре рассматриваются три ключевые проблемы, обсуждаемые в современных работах по зрительному вниманию. Первая касается управления вниманием нисходящими (целенаправленными) и восходящими (стимульно-ведомыми) процессами. Вторая связана с репрезентативной основой зрительного отбора и, в частности, с вопросом о том, имеет ли внимание преимущественно пространственную или объектную природу. Наконец, мы рассматриваем временной ход внимания при его перенаправлении от одного стимула к другому.
КЛЮЧЕВЫЕ СЛОВА: внимание, познание, испытуемые, восприятие, психофизика, время реакции, зрение, зрительный поиск
Мы обсуждаем работы, посвященные трем фундаментальным аспектам внимания, которые находятся в центре большинства современных исследований. Первый из них – управление вниманием или степень, в которой распределение внимания является результатом произвольно вызванного состояния перцептивной готовности (нисходящее, или целенаправленное управление), или, напротив, определяется какими-либо признаками объекта независимо от перцептивных целей человека (восходящее, или стимульно-ведомое управление). Особо мы рассматриваем восходящее управление и взаимодействие между двумя названными способами управления вниманием. Вторая наша тема – репрезентативная основа зрительного отбора. В частности, мы рассматриваем условия, при которых внимание может быть описано как направляемое на участки зрительного поля, что предполагается теориями пространственной основы отбора, или направляемое на перцептивные объекты, выделенные на стадии предвнимания, как считают сторонники теорий объектной природы внимания. И, наконец, мы рассматриваем современные данные о временном ходе внимания в том случае, когда оно движется по зрительному полю, а также когда отбору подлежат события, происходящие последовательно во времени. В этой части рассматриваются различные варианты временной шкалы, на которой могут быть выделены разные этапы внимания (переработки информации).
В одной статье невозможно полностью охватить широкое и активно развивающееся поле исследований внимания. Читатели, заинтересованные в углублении знаний относительно указанных и других аспектов внимания, могут обратиться к трем современным учебным пособиям [15, 61, 79] или нескольким современным монографиям [66, 80, 115]. В дополнение можно посмотреть некоторые статьи по тематике внимания в недавних выпусках Annual Review [16, 49, 57].
СТИМУЛЬНО-ВЕДОМОЕ И ЦЕЛЕНАПРАВЛЕННОЕ УПРАВЛЕНИЕ ВНИМАНИЕМ
Когда Уильям Джеймс [48] более века назад впервые очертил круг явлений внимания, он ввел фундаментальное различение пассивного и активного внимания. В современной психологии внимания используются такие термины для обозначения процессов внимания, как восходящие (bottom-up) и нисходящие (top-down), или, менее метафорично, стимульно-ведомые и целенаправленные процессы. Основная мысль состоит в том, что распределение внимания иногда может практически полностью определяться свойствами образа (например, неожиданное движение на периферии зрительного поля); иногда же оно управляется целями наблюдателя. Накопившиеся данные свидетельствуют о том, что эти две линии управления вниманием едва ли не всегда взаимодействуют. За редким исключением, как свойства зрительного поля, так и ожидания и цели наблюдателя определяют ход внимания в данный момент восприятия. (Вопрос временного хода управления вниманием мы рассматриваем в последней главе.)
За последние 25 лет накопилось множество данных, говорящих о том, что распределение внимания может управляться намерениями наблюдателя. Эта особенность была подмечена Гельмгольцем [42] ещё в прошлом веке, но последствия сознательного распределения внимания для восприятия стали систематически изучаться лишь в 50-х гг. нашего века Мертенсом [69]. Большинство данных, свидетельствующих в пользу нисходящего управления, были рассмотрены в более ранних обзорах [49]. Значительный прогресс в нашем понимании нисходящего распределения внимания начался с продуктивной серии исследований Эриксена с коллегами [28, 29]. В их работах испытуемые должны были опознать букву, помеченную чертой, и игнорировать все остальные буквы ряда. Величина интерференции, вызванной отвлекающими буквами, выступала в качестве показателя эффективности и временного хода распределения внимания. Изучение нисходящего управления вниманием было продолжено в исследованиях Познера с коллегами [81, 85].
Более новые данные касаются «захвата внимания» (attentional capture), или восходящего управления; для этого раздела они будут центральными. Можно выделить два основных класса свойств стимулов, которые могут привлечь внимание: во-первых, единичные стимулы (feature singletons), существенно отличающиеся от остальных одним или несколькими простыми признаками (например, цветом, углом наклона или движением), а во-вторых, неожиданно появляющиеся («вторгающиеся») стимулы (abrupt visual onsets). Мы рассмотрим данные, касающиеся каждого из этих классов стимулов, по очереди, и вернемся к этой теме в разделе «Временной ход внимания».
Единичные стимулы и «захват внимания»
Если задуматься о том, какие свойства стимулов могут привлечь внимание вне зависимости от состояния перцептивной готовности наблюдателя или даже вопреки этому состоянию, вероятно, сразу придут на ум уникальные по какому-либо признаку стимулы. Единичные стимулы оцениваются как субъективно более заметные, и получено множество данных в пользу того, что подобные стимулы могут быть с легкостью обнаружены в процессе зрительного поиска. К примеру, Найссер [73] показал, что наклонные буквы могут быть с легкостью найдены среди прямых; используя несколько другую методику, Эджет с коллегами [23] пришли к сходному заключению. Трейсман и Джелэйд [112], применив ту же методику, что и Эджет с коллегами, показали, что единичные стимулы эффективно обнаруживаются в процессе зрительного поиска. Немало примеров было описано Трейсман и Гормиканом, а также Браво и Накаямой [8, 112]
Все эти примеры, тем не менее, не дают прямого ответа на вопрос, привлекают ли единичные стимулы внимание, поскольку во всех упомянутых выше случаях эти стимулы целевыми и, таким образом, могли вызывать нисходящее, осознанное распределение внимания. Следовательно, нужно спланировать эксперименты, в которых можно было бы явным образом различить перцептивную установку наблюдателя и свойства набора стимулов. Уже есть результаты нескольких таких исследований, но из них были сделаны едва ли не противоположные выводы. Сначала мы рассмотрим те из них, которые могут привести к заключению, что единичные стимулы действительно «захватывают» внимание. Затем обсудим исследования, предполагающие противоположный вывод, а закончим раздел обсуждением работы, которая предлагает вариант согласования этих точек зрения.
ЕДИНИЧНЫЕ СТИМУЛЫ «ЗАХВАТЫВАЮТ» ВНИМАНИЕ. В эксперименте Пэшлера [78] испытуемые должны были искать либо наклонную линию (/) среди множества "О", либо "О" среди множества наклонных линий. Испытуемый не знал заранее, какой именно стимул окажется целевым. В некоторых пробах два символа в наборе стимулов были окрашены в отличный от остальных цвет. Этот признак никогда не имел отношения к заданию, и испытуемых просили игнорировать подобные символы. Пэшлер обнаружил, что время обнаружения целевого стимула увеличивалось в пробах с окрашенными фигурами вне зависимости от намерений испытуемого. На основе этих результатов можно сделать предварительный вывод, что единичные стимулы действительно привлекают внимание.
Дальнейшее исследование условий, при которых единичные стимулы управляют распределением внимания, было проведено Я. Тиусом [103, 105]. Обычно он давал своим испытуемым задачу поиска легко обнаруживаемого целевого стимула (например, ромба) в наборе отвлекающих стимулов (например, кругов). В каждый стимул была помещена линия: в целевом стимуле – горизонтальная или вертикальная, а в отвлекающих стимулах – наклонная. Чтобы продемонстрировать правильное решение задачи по обнаружению целевого стимула, испытуемые должны были сказать, была ли линия внутри целевого стимула вертикальной или горизонтальной. Испытуемым говорили, что эта линия всегда будет содержаться именно в целевом – единичном по форме – стимуле. В половине проб все стимулы были одинакового цвета (например, красные), в другой же половине проб один из стимулов (всегда не целевой формы) отличался по цвету (например, был зеленым). Испытуемым давали инструкцию игнорировать цвет стимулов. Помимо этого, менялось количество элементов на экране – 5, 7 или 9. Время обнаружения не менялось в зависимости от количества стимулов в пробе, что свидетельствует о параллельной переработке информации. Этот эксперимент был во многом похож на исследование Пэшлера. Сходны были и результаты: время обнаружения увеличивалось в пробах, содержащих единичные по цвету стимулы, по сравнению с пробами без подобных стимулов. Тиус сделал следующий вывод: когда испытуемые ищут целевой стимул параллельно, как это происходит в случае единичного по признаку целевого стимула, нисходящее управление невозможно, и внимание привлекается даже нерелевантными единичными по некоторому признаку стимулами.
Еще один пример стимульно-ведомого «захвата» внимания можно найти в недавнем исследовании Джозефа и Оптикана [52]. От испытуемых требовалось найти букву L в наборе букв T. Набор стимулов предъявлялся тахистоскопически, затем на экране появлялась маска. Испытуемые должны были локализовать букву L в одной из четырех частей экрана. Прямо перед целевым набором стимулов испытуемым предъявлялся набор-подсказка. Этот набор состоял из вертикальных линий с единственной горизонтальной линией. Испытуемым давали верную информацию, что локализация горизонтальной линии в подсказывающем наборе никак не соотносится с локализацией целевого стимула в последующем наборе. (Называние неинформативных стимулов «подсказкой» может показаться не вполне адекватным; однако мы следуем здесь традиции применения этого термина в данной исследовательской области.) Тем не менее, ответы испытуемых были более точными, когда подсказка появлялась в том же месте, что и впоследствии целевой стимул. Следовательно, внимание уделялось подсказке, несмотря на то, что она не имела отношения к заданию.
ЕДИНИЧНЫЕ СТИМУЛЫ НЕ «ЗАХВАТЫВАЮТ» ВНИМАНИЯ. Все описанные выше исследования предполагают, что единичные по определенному признаку стимулы привлекают внимание, даже если они не имеют отношения к задаче. Тем не менее, существуют данные и в пользу противоположной позиции. Джонайдес и Янтис [51] показали, что единичные по цвету и яркости стимулы не «захватывают» внимания. В их эксперименте от наблюдателей требовалось найти определенную букву среди других. В каждой пробе одна буква выделялась среди прочих по цвету для одних испытуемых и по яркости для других. Испытуемым сообщали, что целевая буква иногда и будет этим уникальным элементом, но только в отдельных случайных пробах. Таким образом, единичность стимула не помогала испытуемому решать основную задачу – отыскивать целевую букву. Вопрос заключался в следующем: будет ли различаться время обнаружения целевого стимула, если он совпадает либо не совпадает с уникальным по цвету или яркости стимулом? По данным Янтиса и Джонайдеса, ответ отрицателен: обнаружение целевого стимула не осуществляется быстрее, когда он совпадает с уникальным по простому признаку стимулом. Этот результат был впоследствии подтвержден Тиусом [102].
Хиллстром и Янтис [43] показали, что даже движение не всегда «захватывает» внимание. Они просили испытуемых искать перевернутую букву Т среди перевернутых букв L. Один из стимулов в каждой пробе совершал один из пяти типов видимого движения. Во всех случаях локализация движущегося элемента не совпадала с локализацией целевого стимула. Вопрос заключался в том, изменится ли время обнаружения целевого стимула, если он будет совпадать с движущимся. Если движение «захватывает» внимание, то можно было бы ожидать более быстрого обнаружения движущегося целевого стимула по сравнению с неподвижным. Но Хиллстром и Янтис обнаружили, что время обнаружения в этих двух условиях не различалось.
УПРАВЛЕНИЕ ВНИМАНИЕМ. Таким образом, результаты нескольких исследований указывают на то, что единичные по некоторому признаку стимулы «захватывают» внимание, в то время как в других исследованиях было показано противоположное. Бэкон и Эджет [2] попытались примирить эти точки зрения, предположив, что подобное несоответствие результатов может оказаться следствием различных стратегий, используемых испытуемыми. В некоторых обстоятельствах испытуемые работают в режиме выявления единичных стимулов (singleton detection mode), при котором внимание направляется на ту часть набора стимулов, в которой наблюдается наибольшее различие по простым характеристикам. В режиме обнаружения уникальных по какому-либо признаку стимулов может быть осознано место наибольшего контраста, но не сам признак, по которому отличаются стимулы. Таким образом, если испытуемый ищет единственный по форме стимул, внимание может быть «захвачено» не имеющим отношения к задаче стимулом, уникальным по цвету, просто потому, что этот стимул сильнее отличается от остальных.
В других случаях испытуемые могут работать в режиме поиска признаков (feature search mode), когда внимание направляется на участки зрительного поля, в которых выявляется соответствие заданному признаку (например, «красный» или «вертикальный»). Бэкон и Эджет подтвердили это предположение, показав, что «захват» внимания единичным стимулом, не имеющим отношения к задаче, происходит только тогда, когда задание может быть выполнено в режиме обнаружения уникальных по признаку стимулов. Когда эта стратегия становилась неэффективной, «захвата» внимания не имеющим отношения к задаче стимулом не происходило. В одном из экспериментов режим обнаружения единичных стимулов был сделан неэффективным посредством включения в пробу нескольких стимулов, одинаковых по форме с целевым: это служило гарантией того, что ни один из них не может быть уникальным целевым стимулом. В другом эксперименте присутствовало несколько единичных стимулов, которые в то же время не были целевыми, опять-таки гарантируя, что целевой стимул не может быть найден просто путем поиска отличий.
Неожиданно появляющиеся стимулы и «захват» внимания
Другая категория стимулов, которые действуют несколько иначе по сравнению с единичными стимулами – это неожиданные зрительные стимулы (abrupt visual onsets). Ранние исследования свойства неожиданно появляющихся стимулов «захватывать» внимание были основаны на методике подсказки, предложенной Эриксеном с коллегами [28]. Джонайдес [50] показал, что периферическая подсказка (к примеру, линия в том месте, где впоследствии должна появиться целевая буква) привлекает внимание «автоматически», тогда как центральная подсказка в виде стрелки требует сознательного сдвига внимания. Автоматическое воздействие периферической подсказки было продемонстрировано им во втором эксперименте, где периферические подсказки привлекали внимание вне зависимости от того, были ли они информативными или нет, тогда как центральные подсказки управляли распределением внимания лишь в случае их информативности. Ремингтон с коллегами [92] обнаружили, что периферическая подсказка «захватывает» внимание даже в том случае, когда она вообще ни несет никакой информации о местоположении стимула.
Янтис и Джонайдес [124] предположили, что периферические подсказки, сходные с теми, которые использовал Джонайдес [50], могут привлекать внимание потому, что появляются неожиданно. Известно, что магноцеллюлярный зрительный путь очень чувствителен к высоким временным частотам, и одной из его функций может быть оповещение о том, куда нужно направить внимание (эта идея была предложена Брайтмейером и Ганцем [9]). Янтис и Джонайдес разработали эту идею с использованием задачи зрительного поиска, где наблюдателям надо было найти определенную целевую букву в ряду букв. Буквы показывались на дисплее часов и состояли из сегментов стандартной часовой «восьмерки» (стимуляция была заимствована из методики, разработанной Тоддом и Ван Гелдером [108]). Каждая проба начиналась рядом «восьмерок». В действительности же это были буквы, замаскированные дополнительными линиями. Этот ряд удерживался на экране в течение 1 секунды. Затем маскирующие сегменты удалялись с экрана, обнаруживая буквы, и одновременно появлялась одна буква в прежде пустом месте («неожиданная» буква). Целевая буква появлялась в половине проб. Целевая буква имела статус «неожиданной» в 1/n части всех проб с целевой буквой (где n – общее количество букв на экране). Поскольку целевая буква выступала в роли неожиданно появляющегося стимула очень редко, не было никакой причины сознательно направлять внимание именно на этот стимул.
И хотя такой причины не было, Янтис и Джонайдес обнаружили, что скорость обнаружения целевой буквы, когда она оказывалась неожиданно появляющимся стимулом, была выше и не зависела от общего количества элементов. При этом время обнаружения целевой буквы в ряду обычных букв было больше и линейно возрастало с увеличением количества элементов на экране. Авторы пришли к выводу, что неожиданно появляющаяся буква привлекала внимание в каждой пробе. Если целевая буква была «неожиданным» элементом, ответ давался немедленно, и дальнейшего поиска не требовалось; если же «вторгающаяся» буква не была целевой, то должен был быть предпринят поиск, требующий больших затрат внимания. Янтис и Джонайдес показали, что этот «захват» внимания, наблюдающийся в отсутствие адекватной перцептивной установки, можно предотвратить, если побуждать испытуемых фокусировать внимание в другом месте экрана перед каждой пробой. Этот результат был подтвержден Тиусом [104], Кошино с коллегами [60] и Джуолой с коллегами [53] с использованием других методик.
За привлечением внимания неожиданными стимулами могут стоять по крайней мере два механизма. Один из них, упомянутый выше, состоит в том, что появление нового элемента активизирует зрительные пути, чувствительные к высокой частоте предъявления, которые, в свою очередь, направляют внимание к объекту, вызвавшему активацию. Вторая возможность заключается в том, что появление нового перцептивного объекта, требующего создания эпизодической репрезентации, вызывает сдвиг внимания. Эта вторая возможность может быть «жестко детерминированной» реакцией на необходимость опознания новых объектов, возникающих в зрительном поле. Янтис и Хиллстром [123] провели серию экспериментов, позволивших проверить адекватность каждой из гипотез. Они использовали стимулы, равные по яркости фону (например, стереограммы из случайных точек, в которых буквы были составлены из бинокулярно диспаратных точек на фоне с нулевой диспаратностью). Таким образом, на экране не было изменений яркости, но при этом появлялись новые перцептивные объекты. Экспериментальные данные четко соответствовали гипотезе «нового объекта»: внимание «захватывалось» новыми перцептивными объектами, хотя и не происходило нарастания яркости. Хиллстром и Янтис [43] подтвердили этот результат, показав, что, в то время как движение само по себе не привлекает внимания, когда оно не имеет отношения к поставленной задаче (как было отмечено выше), движение, выделяющее объект из фона (например, движение крыльев мотылька, сразу обозначающее его на фоне древесной коры), привлекает внимание. О современном состоянии этой гипотезы см. Гибсон [36, 37] и Янтис и Джонайдес [126].
Взаимодействие целенаправленного и стимульно-ведомого «захвата» внимания
Исследования, которые мы до сих пор рассматривали в этом разделе, свидетельствуют о том, что при определенных обстоятельствах внимание обращается на объекты (единичные или неожиданно появляющиеся стимулы) без сознательного намерения направлять на них внимание. Однако в любом случае свою роль играет и нисходящее управление. Один из примеров нисходящего управления заключается в том, что единичные объекты, не имеющие отношения к поставленной задаче, захватывают внимание, только когда испытуемый работает в режиме обнаружения различий, и распределением внимания управляет степень отличимости признаков. Другой пример – возможность предотвратить или, по крайней мере, уменьшить степень «захвата внимания» неожиданно появляющимися стимулами посредством фокусирования внимания в другой точке экрана.
Фолк с коллегами [34] предложили теоретическое объяснение взаимодействия восходящего и нисходящего управления вниманием. Они утверждают, что каждый перцептивный акт подразумевает «настройку управления вниманием» (attentional control setting), которая является частью эксплицитного или имплицитного набора перцептивных целей наблюдателя на данный момент. Эти цели могут быть результатом инструкции экспериментатора (например, «Ищите красную вертикальную линию») или, как это бывает более часто, индивидуального плана действий в повседневной жизни (например, поиск ключей от машины). Искомые зрительные признаки («красный» или «вертикальный») будут управлять распределением внимания.
Авторы приводят данные в поддержку этой идеи: им удалось показать, что распределение внимания в значительной степени зависит от установки испытуемого. В одном из экспериментов каждая проба состояла из точки фиксации, подсказывающего набора стимулов и целевого набора стимулов. Эти наборы быстро сменяли друг друга. Каждый элемент целевого набора представлял собой либо символ "х", либо символ "=". Использовались два типа целевых проб. Цветные целевые наборы состояли из трех белых элементов и одного красного; задача заключалась в том, чтобы как можно быстрее опознать, был ли красный элемент символом "х" или символом "=". Целевые предъявления «неожиданного» типа содержали только один элемент: таким образом, целевой стимул был единственным «вторгающимся» элементом. Задание в этом случае опять состояло в том, чтобы опознать целевой стимул как "х" или "=". Непосредственно перед целевым набором давалась подсказка: либо цветная (одна из позиций на экране была окружена красными линиями, а другие три – белыми), либо «вторгающаяся» (одна из позиций экрана внезапно выделялась белыми точками, а остальные оставались пустыми). Каждый из типов целевого предъявления комбинировался с каждым из типов подсказки. Информативность подсказки была разной в двух сериях проб: в одном условии подсказка была стопроцентно верной (всегда указывала будущее положение целевого элемента), в другом – стопроцентно неверной (никогда не указывала положение целевого элемента). Фолк с коллегами обнаружили, что в случае совпадения типов подсказки и целевого предъявления (оба цветные или оба «вторгающиеся») информативность подсказки оказывала большое влияние на решение задачи. В частности, испытуемые не могли игнорировать неверные подсказки. Однако когда подсказка и целевой показ были разного типа (например, цветная подсказка и «вторгающийся» целевой элемент), подсказка практически никак не влияла на скорость ответа. Эти данные соответствуют положению о том, что возникающее у испытуемого состояние перцептивной готовности определяет, какие именно типы единичных стимулов смогут «захватить» его внимание.
Сходная идея положена в основу модели управляемого поиска (guided search model) Дж. Вольфа [119, см. также 11, 120]. Согласно этой модели, внимание направляется на объекты в порядке их значимости или приоритетности. Приоритетность объекта определяется одновременно двумя факторами. Первый из них – нисходящая активация: то, насколько объект соответствует текущей перцептивной установке. К примеру, если испытуемый ищет красную вертикальную линию, все красные или вертикальные объекты будут обладать более высокой приоритетностью по сравнению с объектами, не обладающими красным цветом и вертикальностью. Объекты, которые одновременно и красны, и вертикальны, вызовут, конечно же, наибольшую активацию. Другой детерминантой является восходящая активация: насколько данный объект отличается от своего окружения по какому-либо признаку. Например, красный стимул, окруженный зелеными стимулами, вызовет большую восходящую активацию, чем красный стимул, окруженный оранжевыми. Эти два источника объединяются и порождают «карту внимания», которая и определяет порядок перебора объектов во время зрительного поиска.
Обе эти теории содержат в себе принцип, который был провозглашен ещё Уильямом Джеймсом: распределение внимания зависит одновременно от свойств образа и от целей и ожиданий наблюдателя.
РЕПРЕЗЕНТАТИВНАЯ ОСНОВА ЗРИТЕЛЬНОГО ОТБОРА
В немаловажной работе 1981 года Канеман и Хеник поставили вопрос: «Если внимание отбирает некий стимул, что именно является стимулом, который оно выбирает?». До этого момента – за некоторыми исключениями – внимание рассматривалось (эксплицитно или имплицитно) как нечто подобное лучу прожектора, направляемого к участкам пространства и освещающего расположенные там объекты. В пользу такого понимания свидетельствовали в первую очередь факты значимого влияния пространственного разделения элементов на функционирование внимания. Например, Хоффман и Нельсон [45] просили испытуемых опознать целевую букву, которая появлялась на одной из четырех позиций зрительного поля, а затем опознать форму объекта, появлявшегося рядом с буквой или где-то в другом месте экрана. Они обнаружили, что опознание было гораздо более точным, если два стимула соседствовали друг с другом, откуда следовало пространственное ограничение в распределении внимания. Даунинг и Пинкер [17] давали испытуемым подсказку, в соответствии с которой те могли обратить внимание на один из 10 черных квадратов, расположенных горизонтально в ряд (5 штук по каждую сторону от точки фиксации). Задача состояла в выявлении изменения уровня освещенности одного из этих квадратов, чаще всего того, который подсказывался. Скорость решения задачи была самой высокой, когда целевое событие происходило в подсказанном квадрате, и монотонно снижалась по мере удаления целевого квадрата от подсказанного. Эти данные однозначно указывают на пространственный градиент селективного внимания.
Однако Канеман и Хеник [54] призвали читателей учесть возможность того, что внимание может направляться не только на определенные места в пространстве, но и на перцептивные объекты. Их идея состояла в том, что необработанное сетчаточное отображение содержит лишь фрагментарную картину происходящего, тогда как наш перцептивный опыт является связным и «ровным». Следовательно, требуется достаточно ранний зрительный механизм для создания репрезентаций объектов. Раскрытие принципов построения репрезентаций объектов было главной целью гештальтпсихологов. Канеман и Хеник предположили, что часто именно репрезентации объектов, формируемые как следствие перцептивной организации, служат основой зрительного отбора.
Поскольку объекты занимают определенное место в пространстве, в экспериментах, призванных подтвердить гипотезу об объектной основе отбора, должно быть четко показано, что их результаты действительно отражают направление внимания на репрезентации объектов, не меняющих положения в пространстве, а не на места этих объектов в зрительном поле. Для этого применяют несколько исследовательских стратегий. Данные в пользу теорий объектной основы внимания распадаются на две обширных категории. Во-первых, исследованию могут быть подвергнуты места в пространстве или части образа, которые по-разному соотносятся со структурой объекта, но не отличаются по локализации или пространственной удаленности друг от друга. Во-вторых, внимание также может направляться на движущиеся объекты, что подразумевает постоянное изменение пространственной локализации. Внутри каждой из этих категорий существует множество методик исследования.
Одной из самых ранних иллюстраций объектно-специфических эффектов внимания можно считать эксперимент Рока и Гутмана [94], которые показали, что испытуемые могут избирательно обращать внимание на один из двух объектов, предъявляемых в одном и том же месте пространства. Наблюдатели просматривали последовательность из 10 картинок. Каждая картинка включала в себя два наложенных друг на друга контурных изображения нестандартной формы, один красного цвета, а другой – зеленого. Испытуемые должны были вынести эстетическое суждение о красном объекте (или, для второй половины испытуемых, о зеленом) и игнорировать объект другого цвета. Задача на эстетическое суждения была просто прикрытием для того, чтобы побудить испытуемых избирательно обращать внимание на целевые объекты. После просмотра рисунков испытуемым неожиданно давали тест на узнавание. Треть рисунков теста относилась к целевым объектам, треть к игнорируемым, а треть представляла собой новые объекты. Испытуемые с большей вероятностью узнавали целевые, нежели игнорируемые или новые объекты. Их оценки игнорируемых и новых объектов не различались. Эти результаты показывают, что внимание не обязательно должно быть пространственным: вполне возможно избирательное обращение внимания на один из двух совпадающих в пространстве перцептивных объектов.
Дункан [20] провел явное различение теорий пространственной и объектной природы внимания и исследовал это различение эмпирическим путем, разработав перцептивный вариант мнемической задачи Рока и Гутмана. Испытуемые смотрели на экран, на котором предъявлялся прямоугольник с проходящей через середину наклонной линией. Каждый из двух признаков объекта мог принимать два значения: линия могла быть наклонена влево или вправо; кроме того, она могла состоять из точек или из штрихов. Прямоугольник мог быть большим или маленьким и имел разрыв в контуре с правой или с левой стороны. Изображение на экране предъявлялось тахистоскопически, потом следовала маска. Испытуемых просили отчитываться о двух признаках объектов в каждой пробе. В некоторых пробах признаки принадлежали одному объекту (например, наклон и структура линии), а в остальных - разным (например, высота прямоугольника и наклон линии). Ответы испытуемых были более точными, когда признаки, о которых надо было отчитываться, относились к одному объекту. По мнению автора, этот результат свидетельствовал о том, что наблюдатели работают с каждым из объектов как с целым: вынесение суждения об обоих объектах требовало больших затрат переработки из-за необходимости сдвига внимания с одного объекта на другой.
Весера и Фара [116] подтвердили, что результаты Дункана отражают влияние объектной природы зрительного отбора (а не фактора, который они назвали пространственным эффектом «сгруппированного массива» – spatial "grouped array" effect). Как они заметили, гипотеза о пространственной природе отбора предсказывает, что эффект объектной основы отбора должен быть больше, если два объекта разделены в пространстве, чем если они наложены друг на друга. Таких результатов они не получили. Однако когда от испытуемых требовалось выносить суждения, не требующие оценки формы объекта (нужно было обнаружить точку в различных частях контуров объектов), наблюдались только пространственные эффекты. Авторы пришли к заключению, что задания на простое обнаружение могут выполняться и на уровне пространственной репрезентации, тогда как задания на различение форм требует объектных репрезентаций, и, следовательно, в них проявляются объектные эффекты.
Только что описанные исследования с наложением объектов показывают, что можно избирательно направлять внимание на объект, если в том же самом месте находится еще один объект (что предсказывают теории объектной природы внимания). Ещё один способ доказательства объектной природы отбора состоит в демонстрации того, что, когда внимание направляется на одну часть объекта, другие его части тоже получают преимущество в переработке, тогда как равноудаленные части других объектов преимущества не получают. Известно несколько примеров подобного подхода. Бэйлис и Драйвер [5] показали, что суждение о расположении друг относительно друга двух «уголков» сложного стимула давалось испытуемым труднее, если эти уголки принадлежали двум объектам, а не одному. Это явление наблюдалось даже тогда, когда однообъектые и двухобъектные предъявления были физически идентичны, а то, сколько объектов увидит испытуемых, определялось лишь инструкцией. Бэйлис и Драйвер обнаружили, как и Дункан, что суждения о частях одного и того же объекта выносятся быстрее, нежели о частях разных объектов.
Берман, Земель и Мозер (неопубликованная рукопись) описали подобный объектно-специфический эффект с использованием сходной перцептивной задачи. Испытуемым предъявляли два прямоугольника, наклоненных под углом 45 и –45 градусов. Они были наложены друг на друга так, что один из них был как бы «сверху». На двух концах прямоугольников было по две или три «выпуклости», и испытуемым следовало отчитаться, было ли количество выпуклостей на этих концах одинаковым или разным (остальные два конца были гладкими). Наиболее любопытно было то, что концы прямоугольника, о которых следовало вынести суждение, могли оказаться или не оказаться частями одного объекта. К примеру, концы прямоугольников, о которых надо было выносить суждение, могли быть сторонами перекрытого прямоугольника, или один из них мог принадлежать перекрытому прямоугольнику, а другой – перекрывающему. Было установлено, что суждение выносится быстрее о частях одного и того же объекта, чем о частях разных объектов, даже если объект частично закрыт. Этот результат во многих отношениях схож с результатом Дункана. В данном случае, тем не менее, образ перекрытого объекта был «разбит» на две части. Создание целостной репрезентации такого объекта не могло обойтись без механизмов перцептивной организации.
Эгли с коллегами [25] предъявляли испытуемым два вертикально (или, в других пробах, горизонтально) ориентированных прямоугольника стык в стык. На конце одного из прямоугольников появлялась подсказка (коротко подсвечивалась часть контура), и, после небольшой отсрочки, в прямоугольнике появлялся целевой стимул (задача заключалась в его обнаружении). Испытуемым сообщали, что в 80% проб целевой стимул будет появляться в подсказанном месте (верная подсказка), в 10% проб – в другом конце того же самого прямоугольника (подсказка того же объекта), а в остальных 10% проб – в том же конце экрана, но в другом прямоугольнике (подсказка другого объекта). Последние два места были равным образом удалены от места подсказки, но по-разному соотносились с подсказываемым объектом. Авторы обнаружили, что среднее время обнаружения было меньше в случае верной подсказки, чем в остальных случаях. Более интересным было присутствие объектно-специфического эффекта: скорость обнаружения была выше в случае подсказки того же объекта, чем в случае подсказки другого объекта. Этот результат соответствует гипотезе об объектной природе отбора. Сходное исследование было проведено Янтисом и Мур [127]. Они предъявляли испытуемым такие же пары прямоугольников, как в исследовании Эгли с коллегами, но в некоторых пробах помещали перед прямоугольниками загораживающую их поверхность. Вопрос заключался в том, сохранится ли объектно-специфический эффект, полученный в исследовании Эгли с коллегами, если объекты, в которых появится целевой стимул, будут частично перекрыты, и потребуется перцептивная организация для создания их целостной репрезентации (как в неопубликованном исследовании Бермана с коллегами). В результате был получен устойчивый объектно-специфический эффект. Янтис и Мур [127] продолжили исследование и показали, что если задача состояла в вынесении суждения о порядке событий, наблюдались только пространственные эффекты и не было объектно-специфических. Этот результат согласуется с данными, полученными в описанном выше исследовании Весеры и Фары [116].
В нескольких исследованиях было показано, что влияние привлечения внимания к отдельным частям образа зависит от их перцептивной группировки, а не от их пространственной локализации внутри образа. Подобные данные свидетельствуют в пользу теорий объектной основы отбора, при допущении, что в результате перцептивной группировки возникает образ целостного объекта. К примеру, Драйвер и Бэйлис [4, 18] задались вопросом, зависела ли интерференция со стороны игнорируемого стимула во время опознания целевого стимула только от их относительного расположения в пространстве или от более сложных факторов группировки. Они использовали фланговую задачу (flankers task), разработанную Эриксеном и Эриксеном [26], в которой от испытуемых требуется опознать расположенную в центре целевую букву и игнорировать примыкающие к ней отвлекающие буквы. Эриксен и Эриксен обнаружили, что, когда типы ответов, соответствующие целевым и отвлекающим стимулам, конфликтуют, наблюдается значительное снижение скорости ответа. Следовательно, фокус внимания не мог быть ограничен только лишь целевой буквой.
Бэйлис и Драйвер [4] использовали в качестве стимулов цветные буквы. К примеру, в их втором эксперименте предъявлялось пять букв, выстроенных в ряд. Первая, третья и пятая буквы были одного цвета (например, красного), а вторая и четвертая - другого (например, зеленого). Буквы Х и Y требовали одного типа ответа (например, нажать на правую кнопку), а буквы С и S – другого (например, нажать на левую кнопку). Н и Т были нейтральными буквами, не требовали ответа и никогда не выступали в роли целевых букв. Испытуемым следовало нажимать на кнопку, соответствующую третьей (центральной) букве в ряду. Бэйлис и Драйвер обнаружили, что наибольшее влияние на время ответа (ускоряющее или замедляющее) оказывали не ближайшие буквы, а те, которые были сходны по цвету с целевой. К примеру, на то, чтобы опознать целевой стимул строки Хк Нз Sк Нз Хк (строчными буквами обозначены цвета) потребовалось больше времени, чем для строки Нк Хз Sк Хз Нк, несмотря на то, что в последней строке конфликтующие по типу ответа буквы расположены ближе к целевой. Драйвер и Бэйлис получили точно такие же результаты, группируя стимулы по принципу одинакового направления движения.
Эти результаты были подтверждены Крамером и Якобсоном [62], которые установили, что степень интерференции со стороны фланговых элементов зависит от того, соединены ли они посредством черточки с целевым объектом (в этом случае наблюдается сильная интерференция) или с другими объектами (интерференция меньше).
Второй подход к изучению репрезентативной основы отбора состоит в том, чтобы разделить объекты и места в пространстве посредством приведения объектов в движение. Канеман с коллегами [56] использовали методику предварительного предъявления и обнаружили эффект, который впоследствии назвали эффектом объектно-специфического «повторного просмотра» ("re-viewing" effect). Мы опишем здесь упрощенную версию их четвертого эксперимента. Каждая проба начиналась появлением (на 500 миллисекунд) квадрата и треугольника на противоположных сторонах экрана (сверху и снизу относительно точки фиксации). Далее, внутри каждого из объектов появлялась заглавная буква и через 1 секунду исчезала. Всё это составляло «поле предварительного просмотра». Затем пустые объекты двигались к своим новым местам – справа и слева от точки фиксации – в течение 590 мс. После чего они останавливались, и внутри одного из объектов появлялась целевая буква. От испытуемых требовалось как можно быстрее назвать целевую букву при её появлении. Целевая буква могла быть либо одной из двух букв предварительного просмотра, либо новой. Если это была одна из букв предварительного просмотра, она предъявлялась либо внутри того же самого, либо внутри другого объекта. В итоге получилось три возможных типа проб. К примеру, если предварительный просмотр содержал букву S в квадрате и букву Р в треугольнике, то в целевой пробе с тем же объектом будет предъявлялась буква S в квадрате, в пробе с другим объектом – буква S в треугольнике, а в пробе, не соотносящейся с предварительным показом – буква М в любом из объектов.
Канеман с коллегами [56] обнаружили, что время между появлением целевого стимула и его называнием было большим в несвязанных с предварительным показом пробах по сравнению с другими типами проб. Более важно, однако, то, что скорость называния была значительно выше в пробах с тем же объектом, чем в пробах с другим объектом. Авторы интерпретировали этот результат следующим образом. Когда объект появляется в поле зрения, создается его эпизодическая репрезентация («досье объекта»). В досье объекта фиксируется его локализация в пространстве, различные свойства (включая, должно быть, и его название) и текущее состояние. В описанном выше эксперименте досье объектов для квадрата и буквы в нем и для треугольника с буквой в нем создаются в начале пробы во время предварительного просмотра. С появлением целевой буквы после передвижения объектов на новые места досье объекта открывается вновь, и, если в досье объекта, содержащего целевую букву, хранится след целевой буквы (как это происходит в случае пробы с тем же объектом), то скорость называния увеличивается по сравнению с пробами, в которых нет такого соответствия. Это одна из форм объектно-специфической перцептивной преднастройки (priming).
Другое исследование, в котором для различения объектов и мест в пространстве использовалось движение, было проведено Янтисом [122]. Он использовал методику многоэлементного слежения (multi-element visual tracking), созданную Пылышиным и Стормом [87]. В каждой пробе на экране в разных местах появлялись 10 элементов (маленьких значков «плюс»). В них выделялась подгруппа (от 1 до 5 стимулов), которая мелькала несколько раз. Таким образом задавалась целевая группа. Целевые стимулы прекращали мелькать, и все 10 элементов начинали независимо друг от друга двигаться по экрану, меняя в случайные моменты времени направление движения и отскакивая рикошетом друг от друга и от края экрана. По прошествии 7 секунд элементы прекращали движение и один из них мелькал. Испытуемые должны были отчитаться, был ли этот элемент членом целевой группы или нет. Пылышин и Сторм [87] показали, что это задание может быть выполнено с достаточно высокой точностью; в качестве объяснения они предложили теорию зрительного индексирования [86], согласно которой каждый целевой элемент независимо маркируется в начале пробы. Когда один из стимулов в конце пробы начинает мелькать, производится запрос на предмет того, принадлежал ли он к целевой группе.
Янтис [122], напротив, предположил, что это задание было выполнено благодаря группировке целевых элементов в «виртуальный многоугольник», репрезентацию объекта, аналогичную досье объекта. Данные, указывающие на селективное внимание по отношению к целевым элементам, поддерживают идею объектной основы отбора, поскольку целевые и нецелевые элементы не могли различаться испытуемым по локализации в пространстве (по мере своего движения они перемешивались так, что не оставалось такого участка экрана, где находились бы только целевые элементы). Проведенные эксперименты показали, что выполнение задания зависит от факторов, влияющих на лёгкость создания и удержания перцептивных групп. В четвертом эксперименте, к примеру, распределение целевых элементов было свободным или, напротив, кучным, чтобы они оставались соединенными во время движения. Отграничение группы гарантировало, что виртуальный многоугольник не разрушится в процессе движения, и это позволяло наблюдателям использовать единственную репрезентацию объекта во время движения. В случае отграничения целевых стимулов задача выполнялась значительно лучше, чем в случае свободного распределения целевых стимулов.
В ряде исследований была предпринята попытка разделить объекты и места в пространстве с помощью методики торможения возврата (inhibition of return). Привлечение внимания к участку пространства не имеющей отношения к задаче периферической подсказкой может либо замедлить, либо увеличить скорость обнаружения следующего за ней целевого стимула. Когда целевой стимул следует за подсказкой в пределах интервала в 150 миллисекунд, время обнаружения сокращается, если целевой стимул появляется в подсказанном, а не в неподсказанном месте. Считалось, что этот ускоряющий эффект является следствием направления внимания к определенному месту в пространстве. Однако если целевой стимул предъявляется через 300 или более миллисекунд после подсказки, он часто обнаруживается быстрее в неподсказанных местах, чем в подсказанных. Именно этот эффект Познер с коллегами [84] назвали торможением возврата. Мы рассматриваем здесь только один аспект торможения возврата, а именно, связано ли оно с локализацией в пространстве или перцептивным объектом (обсуждение других аспектов этого феномена см. в [1, 58, 65, 88]).
Результаты первоначальных экспериментов наводили на мысль, что торможение возврата привязано к участкам пространства, в частности, к тем, которые заданы в координатах окружения. Однако эти участки пространства очень часто совпадали с объектами. В исследовании Познера и Коэна [82], к примеру, испытуемым предъявлялись квадраты. Подсветка или затемнение этих квадратов служили в качестве подсказок. Целевой стимул мог появиться затем в подсказанном либо в неподсказанном квадрате. Квадраты, однако, предъявлялись в фиксированных местах экрана, и поэтому невозможно было сказать, было ли связано возникающее в результате торможение возврата с определенным местом, объектом или и с тем, и с другим.
Для различения этих двух возможностей Типпер с коллегами [106] использовали в своём исследовании движущиеся квадраты. Испытуемые фиксировали взгляд на точке в центре экрана, вокруг которой по часовой стрелке двигались два квадрата, лежащие на одной линии. В определенный момент этого кругового движения один из квадратов подсказывался (подсвечивался). Затем оба квадрата продолжали двигаться некоторое время до тех пор, пока в одном из них не появлялся целевой стимул (точка). Рассмотрим случай, в котором квадрат был подсказан, достигнув самой крайней левой точки круга, а точка появилась в этом квадрате после того, как квадраты сделали оборот в половину круга (180 градусов) вокруг точки фиксации. Если время обнаружения будет больше при появлении целевого стимула слева, в том же самом месте пространства, что и подсказка, чем при появлении его справа, то более адекватной будет гипотеза пространственной природы внимания. Результаты, полученные Типпером, ясно говорили в пользу противоположной гипотезы. Время обнаружения целевого стимула было медленнее, когда он предъявлялся в подсказанном объекте, что говорит об объектной основе торможения возврата в данных условиях. В последующем исследовании Типпер с коллегами получили данные в пользу как пространственной, так и объектной природы торможения возврата.
Итак, мы различили объектные и пространственные репрезентации. Это простое деление может привести нас к мысли, что, если внимание уделяется объекту, то выигрывает (или, в случае торможения возврата, проигрывает) весь объект равным образом. Мы завершаем эту главу кратким описанием исследования, из которого следует, что репрезентации могут быть более сложными. Гибсон и Эджет [38] утверждают, что представление об объекте как независимом от местоположения не должны приводить к заключению о том, что объект лишен местоположения.
Результатом зрительной переработки является структурное описание объекта, включающее расположение его частей или поверхностей друг относительно друга [46]. Таким образом, хотя объекты отличны от положения в пространстве, которое они занимают, существуют другие – внутриобъектные – места пространства, жестко фиксированные по отношению ко всему объекту. Объект может быть описан как «микросреда», внутри которой специфические места пространства могут быть маркированы механизмами, ответственными за торможение возврата или ускорение переработки. Чтобы подвергнуть эти соображения проверке, Гибсон и Эджет [38] использовали в своих экспериментах компьютерное изображение «кирпича», который вращался в глубину во время предъявления подсказки и следующего за ней целевого стимула. Результаты серии из четырех экспериментов показали, что торможение возврата было связано как с участками кирпича, которые оставались неподвижными по отношению ко всему кирпичу, так и с теми его частями, которые были фиксированы по отношению к окружению.
Перераспределение внимания от одного стимула к другому ни в коем случае не происходит мгновенно. В немалом числе исследований была затронута проблема временного хода уделения внимания. В этом разделе мы рассмотрим следующие вопросы: (а) насколько быстро внимание может быть направлено на отдельный стимул; (б) насколько долго внимание остается направленным на определенный стимул (время задержки внимания); (в) как внимание перемещается от одного места к другому.
Множество работ посвящено тому, каким образом внимание направляется на определенный стимул или участок зрительного поля (см. недавнюю статью в Annual Review [57]). Здесь мы излагаем только основные результаты этих исследований. В экспериментах Эриксена с коллегами [27, 31] в качестве стимулов выступали кратко предъявляемые буквы, расположенные на линии воображаемой окружности. До предъявления букв могла быть показана подсказка, указывающая местонахождение целевой буквы. Точность ответа повышалась с увеличением асинхронии появления стимулов (далее – АПС) – целевого стимула и подсказки (stimulus-onset asynchrony), которую определяют как интервал между моментом появления подсказки и моментом появления стимула. Значительное улучшение наблюдалось уже при АПС всего в 50 мс, а при промежутке в 200 мс эффект подсказки выходил на асимптотический уровень. Однако здесь все не так уж просто, как можно заключить из этого описания. Как говорилось в разделе, посвященном управлению вниманием, существуют два отличных друг от друга механизма, которые могут отвечать за направление внимания к определенному месту в пространстве: стимульно-ведомый и целенаправленный. Мы рассматриваем здесь исследования, выявляющие временной ход работы данных механизмов.
В исследовании Мюллера и Рэббита [71] испытуемые должны были фиксировать взгляд в центре экрана, в то время как на периферии появлялись четыре прямоугольника, расположенные в углах воображаемого квадрата большего размера. Испытуемые должны были отчитаться об угле поворота буквы T в одном из прямоугольников, в остальных прямоугольниках появлялся знак «+». Перед появлением этих фигур испытуемым дававали подсказку: либо коротко подсвечивали один из четырех прямоугольников (периферическая подсказка), либо помещали в центр экрана стрелочку, указывающую на один прямоугольников (ценральная подсказка). Подсказки были частично верны. В половине случаев они указывали на прямоугольник, в котором появлялась целевая буква, в половине – на прямоугольник, в котором потом предъявлялся «+». Скорость выполнения задачи рассматривалась как функция от времени задержки между стимулом и подсказкой. Результаты показали, что влияние периферической подсказки на выполнение задачи наблюдается очень быстро. К примеру, при предъявлении верной периферической подсказки скорость выполнения уже довольно высока даже при минимальной асинхронии предъявления подсказки и целевого стимула (100 мс). Она увеличивалась при интервале 175 мс и затем несколько снижалась до стабильного уровня после 400 мс. Верная центральная подсказка, напротив, при интервале 100 мс была малоэффективной; скорость выполнения задания равномерно возрастала, вплоть до интервала 400 мс, после чего достигала примерно того же стабильного уровня, что и при периферической подсказке. Периферическая подсказка была, таким образом, охарактеризована как подсказка, вызывающая быструю и преходящую реакцию, тогда как центральная подсказка вызывает медленный и устойчивый ответ. В частности, центральная подсказка влечет за собой сознательный сдвиг внимания, который отличается монотонным возрастанием скорости ответа до асимптотического уровня, тогда как периферическая подсказки приводит к быстрому возрастанию скорости ответа, а затем к ее снижению до некоторого стабильного уровня (и, возможно, к торможению возврата при более длинных интервалах). Схожие результаты были получены Крозе и Юлешом [63], Накаямой и Макэбеном [72] и Чилом и Лайоном [12].
ЗРИТЕЛЬНЫЙ ПОИСК. Методика зрительного поиска используется в большинстве современных исследований внимания. Среди прочего, эта методика применяется для оценки количества времени, затрачиваемого на каждый из предъявляемых на экране стимулов. Рассмотрим для начала задачу поиска произвольно повернутой буквы T среди произвольно перевернутых букв L [7, 24, 120]. Эта задача предъявляет требования к вниманию и подразумевает последовательную переработку (т.е. затраты некоторого количества времени на анализ каждого из стимулов). Если построить график среднего времени ответа для проб с разным количеством стимулов, полученные в результате функции для проб с наличием и с отсутствием целевого стимула будут примерно линейными с углами наклона в отношении 2:1 друг к другу. К примеру, в исследовании Вольфа с коллегами [120] в пробах с целевым стимулом и без него на каждый стимул приходилось в среднем 19,2 и 41,6 мс (в одном условии), или 24,9 и 60,9 мс (в другом условии) соответственно. Эти результаты указывают на последовательный поиск, при котором на проверку каждого стимула уходит примерно 50 мс до тех пор, пока не будет обнаружен целевой; график средних времен ответа для проб с целевым стимулом располагается ниже благодаря тому, что испытуемый находит целевой стимул после просмотра примерно половины стимулов (в среднем) и прекращает поиск. График для проб без целевого стимула указывает на время, в течение которого внимание задерживается на одном стимуле перед тем, как начнет перемещаться к другому. Очевидно, что время задержки внимания зависит от многих факторов, таких, например, как сложность различения целевого и отвлекающих стимулов.
Использование графиков зрительного поиска для оценки времени задержки внимания на каждом из стимулов обладает внешней валидностью, однако некоторые проблемы с интерпретацией результатов остаются нерешенными. Возможно, самая большая проблема заключается в том, что подразумеваемая в даном случае модель последовательного поиска может не соответствовать реальному положению дел. Предположим, к примеру, что отвлекающие стимулы отбрасываются в параллельном режиме некоторым механизмом с ограниченной пропускной способностью (таким, что ему требуется тем больше времени для работы, чем большее количество стимулов содержится в наборе). При этом все еще можно, конечно, построить график поиска, но он уже не будет отражать временной ход внимания при движении от одного дискретного стимула к другому. Примеры моделей с различными степенями и типами параллелелизма можно найти у Дункана и Хамфриса [21], Гроссберга с коллегами [40], Хоффмана [44], Палмера и МакЛина [77] и Вольфа [119].
БЫСТРОЕ ПОСЛЕДОВАТЕЛЬНОЕ ПРЕДЪЯВЛЕНИЕ ЗРИТЕЛЬНЫХ СТИМУЛОВ (rapid serial visual presentation, или RSVP): ПОЛНЫЙ ОТЧЕТ. Если мы выйдем за рамки задач зрительного поиска, мы сможем обнаружить и другие методики, способные пролить свет на временной ход внимания. Некоторые из них предполагают последовательное предъявление стимулов в противоположность одновременному предъявлению, которое имеет место при задачах зрительного поиска. В некоторых исследованиях с последовательным предъявлением были получены меньшие, чем в опытах со зрительным поиском, оценки времени задержки внимания, а в некоторых и большие.
Сааринен и Юлеш [95] предъявляли 2, 3 или 4 цифры в случайном месте на линии окружности с центром в точке фиксации. Затем на месте каждой цифры предъявлялась маска. И стимул, и маска держались на экране в течение 33 мс, и между ними вводился ничем не заполненный интервал различной длительности (0, 33 или 67 мс). Маска появлялась на экране одновременно с предъявлением следующей цифры. Таким образом, величина АПС в этом эксперименте составляла 33, 67 или 100 мс. В конце пробы испытуемый должен был отчитаться обо всех предъявленных цифрах в правильном порядке. Неудивительно, что с возрастанием количества цифр в пробе пропорция проб, в которых испытуемый мог правильно опознать всю последовательность, уменьшалась. Авторы подчеркивают, тем не менее, что количество опознанных букв в пробе было больше случайного даже при предъявлении 4 цифр в последовательности с минимальной величиной АПС (33 мс). Они пришли к заключению, что скорость работы фокального зрительного внимания может быть достаточно высокой (по крайней мере 50 мс на 1 стимул), при все еще сносном выполнении задания в условиях, когда на обработку стимула отводилось 33 мс.
В последующем эксперименте Ханга с коллегами [47] время предъявления было сокращено до 16,5 мс; в дополнение к этому, в одном из условий цифры предъявлялись одновременно. Задача опять выполнялась на уровне выше случайного угадывания, причем даже в последовательностях с четырьмя цифрами и минимальной АПС (16,5 мс). Точность отчета о последовательности в правильном порядке была в этом условии 0,2%; случайный же уровень выполнения задания оценивался в 0,02%.
Однако использование в качестве отправной точки того факта, что выполнение задания было лучше случайного, сталкивается с некоторыми проблемами. Предположим, что испытуемые всегда ясно видели первую букву, но из-за ограничений переработки никогда не видели последующих, которые они могли только угадывать. Переработка даже такого минимума информации ведет к лучшему, чем случайное угадывание, выполнению задания, но этот уровень выполнения никоим образом не может быть переведен в осмысленную оценку времени задержки внимания на каждом стимуле. По нашим собственным подсчетам, в исследовании Сааринена и Юлеша выполнение задания было слишком хорошим, чтобы быть результатом восприятия одной буквы и угадывания остальных трех. Больше похоже на то, что испытуемые видели три буквы и угадывали лишь одну. Таким образом, результаты работы Юлеша с коллегами предполагают высокую скорость фокального внимания, хотя остается неясным, возможна ли точная оценка этой скорости с использованием их методики.
В исследованиях Сааринена и Юлеша [95] и Ханга с коллегами [47] была предпринята попытка измерить время задержки внимания путем оценки предельной скорости предъявления последовательности стимулов, при которой уровень выполнения задачи все еще остается выше уровня случайного угадывания. Центральным для иного подхода к оценке времени задержки внимания является вопрос, насколько медленно должны предъявляться стимулы, чтобы точность ответов испытуемого оставалась высокой. Ранние исследования с использованием RSVP были посвящены чтению, и поэтому в них предъявлялись ряды букв, формирующие слова. Колерс и Кацман [59] предъявляли последовательно 6 букв в одном и том же месте экрана и обнаружили, что для точного отчета о воспринятых буквах (точность более 90%) требовалась АПС около 370 мс. Хаббер и Натансон [41] использовали сходный способ предъявления стимулов: они побуквенно предъявляли испытуемым слова, варьирующие по длине от 4 до 8 букв. Было установлено, что АПС, необходимая для выхода точности выполнения на асимптотический уровень, возрастала с увеличением длины слов. По их подсчетам, критическая величина АПС для четырехбуквенных слов составляла 65 мс, а для восьмибуквенных – 110 мс. Хабер и Натансон приводят несколько доводов в пользу того, что найденная ими взаимосвязь между длиной слова и АПС может быть артефактом. К примеру, перед первой буквой или после последней не было маски. Таким образом, в четырехбуквенном списке были легкодоступны для восприятия половина букв (2 из 4), а в восьмибуквенном – только четверть (2 из 8). Таким образом, не исключено, что оценка времени переработки в 65 мс слишком мала. Возможно также, что и величина 110 мс является преуменьшенной, по крайней мере при учете результатов Трэверса [111]. При предъявлении букв слова последовательно (в течении 375 мс каждой) в одном и том же месте (когда последовательность предварялась и завершалась маской) были правильно опознаны примерно 80-85% слов.
БЫСТРОЕ ПОСЛЕДОВАТЕЛЬНОЕ ПРЕДЪЯВЛЕНИЕ ЗРИТЕЛЬНЫХ СТИМУЛОВ: ЧАСТИЧНЫЙ ОТЧЕТ. Одной из проблем интерпретации данных, полученных в упомянутых выше исследованиях, является то, что использование слов дает возможность применения практически всех видов стратегий угадывания. Чтобы избежать этих проблем, можно предъявлять случайные последовательности букв [59, 111]. Однако этот метод также имеет слабые стороны. В частности, результат такого исследования может больше зависеть от работы памяти, чем от работы внимания. Решением может быть снятие требования полного отчета об увиденном [100]. Именно такой подход лег в основу множества интересных экспериментов. Объединяет их все то, что от испытуемого требуется отчет только об одном или двух целевых стимулах, которые чем-то отличаются от остальных.
В серии из четырех экспериментов Бродбент и Бродбент [10] по-разному задавали целевые стимулы среди отвлекающих. В одном из экспериментов испытуемые должны были отчитываться о двух словах, напечатанных заглавными буквами, среди быстро последовательно предъявляемых слов из строчных букв. Испытуемые были не в состоянии отчитаться об обоих целевых стимулах, если они находились на смежных позициях временного ряда. Более того, отчет продолжал быть затруднительным, даже если целевые слова были разделены одним, двумя или тремя отвлекающими стимулами. (Заметим, что при времени предъявления, равном 80 мс, и предъявлении трех отвлекающих стимулов между целевыми асинхрония появления целевых стимулов составляла 320 мс.) В другом эксперименте, где использовался более сложный способ задания целевых стимулов (они обозначались присутствием дефиса с одной или с другой стороны), трудности с отчетом об обоих словах сохранялись вплоть до 480-миллисекундной асинхронии появления этих стимулов. Трудности с отчетом об обоих стимулах отнюдь не специфичны для ситуаций, в которых целевой и отвлекающие стимулы различаются какой-либо простой физической характеристикой. Сходные результаты были получены в задании, в котором все слова были напечатаны строчными буквами, и нужно было отчитываться о названиях животных. Подобная длительность рефрактерного периода согласуется с идеей Дункана [19] о том, что переработка двух целевых стимулов в одно и то же время затруднительна.
Исследования с использованием методик RSVP дают нам возможность понять, что означает словосочетание «в одно и то же время». Грубо говоря, нарушение опознания второго целевого стимула рассматривается как отражение длительности переработки первого целевого стимула. Однако это упрощение. Когда стимулы следуют один за другим очень быстро, испытуемые часто воспринимают их в «неправильном» порядке. К примеру, в экспериментах Бродбент и Бродбента [10] с целевыми словами из заглавных букв вероятность отчета о первом и втором словах была 0,46 и 0,35 соответственно, если они были смежными во времени, но вероятность отчета о них обоих составляла лишь 0,075. Очевидно, что во многих пробах испытуемые могли отчитаться о втором слове, не будучи в состоянии отчитаться о первом. Напротив, когда целевые стимулы были разделены тремя отвлекающими, соответствующие вероятности были равны 0,45, 0,14 и 0, 075. Здесь трудности в отчете можно отнести главным образом (хотя и не полностью) на счет затянувшейся переработки первого целевого стимула. Ривз и Сперлинг [91] и Вайзельгартнер и Сперлинг [118] осуществили детальный анализ временных характеристик внимания в заданиях с несколькими целевыми стимулами.
Изложенные выше результаты исследований с использованием методик RSVP указывают, что направление внимания на один из стимулов стимульного ряда приводит к длительным затруднениям переработки. Природа этих затруднений не ясна. В исследованиях, требующих опознания слов, трудности могут быть связаны как с самим опознанием слов, так и с каким-либо зрительным процессом более низкого уровня. Сходным образом, в исследовании Вайхзельгартнера и Сперлинга [118] нарушения переработки могут быть связаны с работой механизмов памяти, восприятия или внимания. Реймонд с коллегами [89] предположили, что в этих исследованиях наблюдаются эффекты подавления переработки зрительной информации. Они пишут: «Эти данные говорят о том, что механизмы, участвующие в опознании стимула, временно отключаются после их использования. Механизмы восприятия и внимания ведут себя так, как если бы они "мигнули"» (стр.851).
Реймонд с коллегами [89] провели эксперимент с использованием методики RSVP с двойным заданием, причем требования к ответу были менее жесткими, чем в предшествующих исследованиях. Испытуемым последовательно предъявлялись буквы с частотой 11 букв в секунду. Одна буква была белой, все остальные – черными. Испытуемые должны были опознать одну белую букву. В половине проб на одной из позиций ряда предъявлялась буква Х (но никогда до белой буквы). В другой половине проб буквы Х не было. После называния белой буквы испытуемый должен был сказать, появлялась ли в ряду буква Х. Заметим, что в некоторых пробах белая буквы оказывалась одновременно буквой Х. Ни одно из заданий не требовало немедленного отчета в момент появления стимула, но и нагрузка на память была минимальной. В центре исследования были последствия уделения внимания целевому стимулу; поэтому белая буква считалась целевой, а буква Х – зондовой. В контрольном условии испытуемые должны были игнорировать белую букву и сообщать только о появлении зондового стимула. Заметим, что стимульные ряды в экспериментальном и контрольном условиях были идентичными. Это позволяет установить, являются ли трудности переработки после предъявления целевого стимула следствием сенсорных факторов (таких, как маскировка зонда целевым стимулом) или требований к вниманию со стороны задачи опознания целевого стимула.
Данные были представлены как функция количества правильных обнаружений зонда (в %) от позиции зонда в ряду стимулов. Когда испытуемым не нужно было опознавать белую букву, вероятность обнаружения зонда была довольно высокой (в среднем около 90%) и не зависела от позиции зонда. Но когда испытуемые должны были опознавать белую букву, вероятность обнаружения зонда на нулевой позиции (когда целевой и зондовый стимулы совпадали) была такой же, как и в контрольном условии, и монотонно снижалась вплоть до третьей позиции, где становилась менее 50%. После этого частота обнаружения постепенно возрастала до тех пор, пока (на шестой позиции) вновь не достигала уровня контрольного условия. Это временное снижение уровня выполнения задания был назван Реймонд с коллегами «миганием внимания». В данном исследовании этот эффект был статистически значим в интервале 180-450 мс после предъявления целевого стимула. Нас же главным образом интересует сам факт существования и величина эффекта «мигания внимания». Недавно было предпринято несколько попыток теоретически объяснить этот феномен [14, 39, 90,97].
БЫСТРОЕ ПОСЛЕДОВАТЕЛЬНОЕ ПРЕДЪЯВЛЕНИЕ ЗРИТЕЛЬНЫХ СТИМУЛОВ: КОРОТКИЕ ПОСЛЕДОВАТЕЛЬНОСТИ. Методика частичного отчета является упрощением методики полного отчета. Тем не менее, быстрое предъявление большой последовательности стимулов, требующее их отбора на высокой скорости, является сложным заданием. В дальнейшем было сделано еще одно упрощение данной методики. Дункан с коллегами [22, 117] предъявляли последовательно только два стимула и просили испытуемого опознать их оба. Стимулы предъявлялись в двух разных местах; после каждого стимула следовала маска. Если стимулы предъявлялись близко друг к другу во времени, первый стимул интерферировал со вторым. Исследователи измеряли интервал, в течении которого сохранялась интерференция. Они рассматривали эту величину (обозначенную ими как «время времени внимания») как отражение динамики затрат внимания на переработку первого объекта. Их результаты соотносятся с другими оценками из литературы по RSVP. Время задержки внимания в их эксперименте исчислялось сотнями миллисекунд. С достаточно высокой степенью приближения можно сказать, что оно составляло около 500 мс.
Простота экспериментальной процедуры может быть сочтена, вероятно, самым сильным доказательством того, что в процессе поиска невозможно столь быстрое переключение между объектами, как нас заставляют предположить результаты измерения времени реакции при решении стандартных задач зрительного поиска.
В ЧЕМ ПРИЧИНЫ РАСХОЖДЕНИЯ РЕЗУЛЬТАТОВ? Мы считаем высокоскоростные оценки времени задержки внимания (17-33 мс на стимул), полученные в исследованиях Сааринена и Юлеша (1991) [95] и Ханга с коллегами (1995) [47], довольно соблазнительными, но, по указанным выше причинам, недостаточно надежными для того, чтобы служить в качестве основы для дальнейших теоретических рассуждений. Остается в таком случае только понять, почему результаты задач на зрительный поиск (50 мс на объект) и результаты методики RSVP (500 мс на объект) столь разительно различаются. Этот раздел статьи можно считать чисто теоретическим, поскольку исследованию данного вопроса было пока что посвящено довольно мало исследований.
Мур с коллегами (1996) [70] подчеркивают, что в экспериментах Дункана с коллегами (1994) [22] и Уарда с коллегами (1996) [117] предъявление стимулов сопровождалось маской. Обычно маскировка стимулов не применяется в задачах на зрительный поиск. Если время задержки внимания зависит от специфики стимулов и задач, тогда несогласованность результатов является скорее кажущейся, чем реальной. Или, если выразиться более определенно, внимание может оставаться сфокусированным дольше в случаях сложных задач на различение по сравнению с простыми, и можно предположить, что маскировка стимулов усложняет задачу различения и поэтому приводит к увеличению времени задержки внимания.
Эксперимент Мур с коллегами (1996) [70] был организован в целом так же, как эксперименты Дункана с коллегами. Существенное различие состояло в том, что в одном из условий первый и второй стимулы маскировались немедленно после предъявления каждого из них (как у Дункана с коллегами), тогда как в другом условии первый и второй стимулы маскировались одновременно (сразу после предъявления второго стимула). Исследователей интересовало, изменится ли время задержки внимания в зависимости от способа предъявления маски. Время задержки внимания изменилось. Оно уменьшилось примерно до 200 мс. И хотя полученное время задержки внимания было больше, чем в задачах на зрительный поиск, по сравнению с результатами Дункана и коллег оно было меньше почти в два раза. Можно предположить, что другие модификации методики могут привести к дальнейшему уменьшению этой величины.
Следующая попытка преодолеть пропасть между методиками зрительного и быстрого последовательного предъявления зрительных стимулов была предпринята Беннетом и Вольфом (1996) [6]. В их исследовании испытуемые искали различным образом повернутую букву Т среди различным образом повернутых букв L: эта задача требует последовательной переработки. Стимулы предъявлялись по одному в случайных местах на большом экране. АПС изменялась в различных пробах и составляла 26, 52, 78 или 104 мс. После появления стимул оставался на экране до конца пробы. Время реакции измерялось с начала пробы до ответа испытуемого (нажатия на кнопку). Авторов интересовало, насколько испытуемый сможет «успевать» за предъявлением стимулов. Если испытуемые могли перемещать внимание от стимула к стимулу с той же скоростью, с какой эти стимулы предъявлялись, тогда коэффициент наклона графика отношения среднего времени обнаружения ко времени предъявления стимулов в последовательности должен был быть равен 1. Семь испытуемых справились с задачей при АПС, равной 104, 78 и 52 мс, и «выпадали» из хода работы только при интервале в 26 мс. Результаты работы говорят о том, что испытуемые могут различать перевернутые символы T и L на скорости около 50 мс на стимул.
Этой интересной методикой и её результатами мы замыкаем круг. Хотя предъявление стимулов было последовательным, оценка времени задержки внимания была столь же небольшой, как в классических исследованиях зрительного поиска с одновременным предъявлением стимулов. Неясно пока, в каких именно особенностях этих различных методик кроется причина такой несогласованности результатов; это задача для дальнейших исследований. Тем не менее, кажется разумным, вслед за Чаном, Вольфом и Поттер (неопубликованная рукопись) сделать следующий вывод: «если и можно “стреножить” внимание на несколько сотен миллисекунд после обнаружения целевого стимула, это ни в коем случае не говорит о том, что именно такова минимальная величина времени задержки внимания, требуемая для его успешной переработки».
Большинство исследователей признают, что внимание может быть перенаправлено от одного к другому месту зрительного поля без каких-либо сопутствующих движений глаз. Однако природа этого сдвига менее ясна. Движется ли внимание аналоговым, непрерывным способом, или сдвиг внимания осуществляется дискретно, без какого-либо реального «движения»? Несколько исследователей получили результаты в поддержку гипотезы, согласно которой внимание, подобно прожектору, непрерывно движется по пространству, и, таким образом, ему требуется тем больше времени на перемещение, чем больше расстояние. Например, Цаль (1983) [114] ставил перед испытуемыми задачу быстро обнаружить символ X среди множества символов O; стимулы предъявлялись в 4, 8, 12 градусах слева или справа от точки фиксации. За некоторое (переменное) время перед предъявлением буквы, в том месте, где она должна была появиться, коротко вспыхивала подсказка. Цаль рассудил, что подсказка должна способствовать решению задачи. Предположив далее, что вниманию нужно время на передвижение, он пришел к мысли, что максимальная польза от подсказки будет иметь место тем позже во времени, чем дальше от точки фиксации появлялся стимул. Именно такие результаты он и получил в своем исследовании.
Это исследование, предполагающее что внимание движется аналоговым образом, критиковалось впоследствии Эриксеном и Мерфи (1987) [30], а также Янтисом (1988) [121]. К примеру, один из спорных моментов в исследовании Цаля заключалась в том, что в нем не контролировался общий уровень бдительности или активации испытуемых. Янтис счел, что эксперименты и Цаля, и Шульмана с коллегами [99] «не дают возможности сделать вывод, носят ли сдвиги внимания непрерывный или дискретный характер». Однако есть и другие подходы, в которых удается избежать сложностей вышеуказанных исследований.
Сажи и Юлеш (1985) [96] получили данные в пользу дискретного перенаправления внимания. Испытуемые должны были определить, были ли два одовременно предъявляемых стимула одинаковыми или нет. Повернутые различным образом буквы T и L предъявлялись на разном расстоянии друг от друга и сразу маскировались для ограничения времени их анализа. Наиболее интересный результат заключался в том, что при любой асинхронии предъявления стимула и маски точность различения не зависела от расстояния между стимулами, что было расценено исследователями как свидетельство «быстрых и неинерционных сдвигов внимания».
Сходные данные в пользу независимости времени перемещения внимания от расстояния между стимулами были получены в исследовании Квака с коллегами (1991) [64]. Испытуемые выносили суждения типа «одинаковые/разные» о парах символов T и L на различном расстоянии друг от друга. В их экспериментах стимулы появлялись на различном расстоянии друг от друга на линии воображаемого круга, чтобы испытуемый не мог догадаться о месте следующего предъявления. Зависимой переменной было время ответа. Как и в исследованиях Сажи и Юлеша, уровень выполнения задания не зависел от расстояния между стимулами. Это было верно как для прямых, так и для перевернутых символов T и L. Ремингтон и Пирс (1984) [93] тоже получили подобные результаты.
В исследованиях Сажи и Юлеша и Квака с коллегами очень важно было установить, что задания действительно требовали затрат внимания. Если бы задания выполнялись на предвнимательном уровне, не было бы практически никаких оснований говорить о «перенаправлении» внимания. Мы сконцентрируется здесь на рассуждениях Квака с коллегами. Чтобы установить, что два стимула были обследованы один за другим, они использовали диагностическую процедуру, основанную на аддитивности результатов в случае изменения качества (степени различимости) предъявляемых стимулов в пределах пробы. Этот индикатор применим в ситуациях, в которых переработка стимулов оказывается ресурсоемкой. Именно такова задача на сопоставление двух букв, поскольку для получения правильного ответа должны быть обследованы оба стимула.
Две буквы в пробе независимо друг от друга обладали либо низким, либо высоким контрастом. Если буквы перерабатываются последовательно, то замедление, вызванное предъявлением низко контрастной буквы, должно быть аддитивным. Иными словами, если предъявление одного низкоконтрастного стимула увеличивает время обработки на 20 мс, то в случае, когда оба стимула низкоконтрастны, среднее время ответа должно увеличиваться на 40 мс. Если же переработка параллельна, то замедление в 20 мс при предъявлении одной низкоконтрастной буквы не должно возрастать, если другая буква тоже будет низкоконтрастной. В этом случае эффект уменьшения контрастности для двух букв должен быть субаддитивен. Результаты явно продемонстрировали аддитивность влияния контрастности стимулов при сравнении перевернутых символов T и L. Таким образом, внимание должно было перемещаться последовательно от одного стимула к другому. Сажи и Юлеш [96] использовали другой способ проверки, который тоже указал на последовательный характер переработки. Таким образом, в данном случае действительно можно говорить о том, что отсутствие влияния манипуляции расстоянием между стимулами свидетельствует о независимости времени перемещения внимания от этого расстояния.
Сперлинг и Вайхзельгартнер [101], независимо от предыдущих исследователей, получили данные в пользу того, что перемещение внимания на более далекие расстояния по сравнению с исходно заданным не требует дополнительного времени. Более того, они показали, что внимание может "перескочить" через стоящее на его пути препятствие без временных затрат. Сведенные вместе, эти результаты означают, что перемещение внимания имеет скорее "квантовую", нежели аналоговую природу.
Проведенный нами обзор демонстрирует значительный прогресс в развитии представлений о внимании на современном этапе исследований. Конечно, многие из проблем и даже некоторые из механизмов, занимающих страницы журналов сегодня, были в каком-то смысле предсказаны около века назад Уильямом Джеймсом и другими авторами. Тем не менее, сейчас разъяснились многие эмпирические подробности, появились и были разработаны новые продуктивные теории и идеи (такие, как различение объектной и пространственной основы отбора). Нет причин полагать, что это развитие в скором времени прекратится: поведенческие исследования внимания, подкрепленные данными функционального магнитно-резонансного картирования работающего мозга и нейропсихологических исследований пациентов с различными локальными поражениями мозга, сулят перспективу новых открытий в области зрительного внимания.
Обнаружен организм с крупнейшим геномом Новокаледонский вид вилочного папоротника Tmesipteris oblanceolata, произрастающий в Новой Каледонии, имеет геном размером 160,45 гигапары, что более чем в 50 раз превышает размер генома человека. | Тематическая статья: Тема осмысления |
Рецензия: Рецензия на книгу Дубынина В.А. Мозг и его потребности. От питания до признания | Топик ТК: Интервью с Константином Анохиным |
| ||||||||||||