Нейрофизиология зрения и сущность зрительных образов

← К списку тем раздела «Психофизиология»

Mist 16.09.2012 22:37
Приветствую участников форума!

С интересом читаю материалы scorcher.ru, посвящённые ИИ и нейрофизиологии. Возможно, эрудиты сайта могут что-нибудь подсказать по интересующим меня вопросам: на каком этапе сейчас исследования нейрофизиологии зрения, есть ли по этому вопросу современная (не 80-х, 90-х годов) литература на русском? Быть может, имеются толковые статьи по ИИ, раскрывающие теорию формирования зрительных образов?
Тема интересует в первую очередь с точки зрения искусственного интеллекта и моделирования, т. е. хотелось бы не просто почитать, какие функции выходят из строя у котят при сенсорной депривации на такой-то неделе, а узнать, каков алгоритм работы зрительной системы млекопитающих.

Если такое есть, конечно :) Был бы очень признателен.
nan 17.09.2012 08:28

>>Быть может, имеются толковые статьи по ИИ, раскрывающие теорию формирования зрительных образов?

главный прикол в том, что образами мы, не задумываясь особо, называем вовсе не профиль возбуждения зрительных распознавателей, а уже субъективизированную картину, т.е. признаки восприятия связываются в динамическую систему со смыслом того, что именно означают они в данных условиях восприятия и данном состоянии организма. А это вопрос, далеко выходящий за рамки узкой специальности, такой как нейрофизиология и требует более широких рамок исследования, в частности механизмов сознания (любой субъективизированный образ - результат осознания). Поэтому и нет пока книг матерых (признанных в мире) исследователей.

На этом сайте как раз по теме вчера опубликована статья, показывающая в общих чертах, как это принципиально реализуется.

Mist 17.09.2012 12:00
>>На этом сайте как раз по теме вчера опубликована статья
Спасибо, ознакомился. К сожалению, там только самые общие принципы - на таком-то уровне я вопрос понимаю.

>>главный прикол в том, что образами мы, не задумываясь особо, называем вовсе не профиль возбуждения зрительных распознавателей, а уже субъективизированную картину
Лично мне на первых порах хватило бы и объективизированной :). В смысле, алгоритма работы самой подсистемы зрения, насколько её возможно отделить от всего остального. Ключевыми вопросами проблемы мне кажутся:
1) Как формируются все эти распознаватели с более-менее сложными рецептивными полями. Видимо, многоуровневая кластеризация, но каков метод?
2) Способ выделения целостных сущностей из облака разрозненных рецептивных полей.
3) Как достигается инвариантность к положению/угловому размеру объекта.
Есть ещё 4 - интеграция с другими сенсорными подсистемами, моторикой и собственно мышлением, но не всё сразу :)
К сожалению, серьёзных ответов на эти вопросы я пока не встречал. Вместе с тем, судя по сообщениям в прессе, да и общедоступным программам, технологии распознавания таки шагнули далеко вперёд - в частности, лица на изображениях умеют выделять и распознавать уже достаточно надёжно. Отсюда и чувство, что где-то должны быть толковые материалы по проблеме, а не только учебники с общими фразами. Конечно, есть искусственные нейронные сети, но в том виде, в каком они описаны в учебниках, ИНС явно не могут служить аналогом настоящего зрения.

P. S.: если с млекопитающими всё плохо, может, нейрофизиологи хотя бы лягушку расколупали до полной ясности?..
nan 17.09.2012 14:02

>>там только самые общие принципы - на таком-то уровне я вопрос понимаю

это может быть иллюзией (судя по задаваемым вопросам) потому как на самом деле, несмотря на очень лаконичное изложение, все сопровождается ссылками для пояснений, материалы по которым и раскрывают механизмы.

 

>>Лично мне на первых порах хватило бы и объективизированной

это - как раз наиболее сложное представление.

>>В смысле, алгоритма работы самой подсистемы зрения

такой подсистемы не существует в природной реализации... Есть зрительный анализатор, есть иерархически усложняющаяся система распознавателей зрительных примитивов. На таком уровне природная реализация очень хорошо изучена и описана в учебниках. А вот использование примитивов на основе рецепторов восприятия - уже на грани общепризнанного понимая.

>>1) Как формируются все эти распознаватели с более-менее сложными рецептивными полями.

вот как раз этот вопрос - уже тривиален [subject_id=26].

>>2) Способ выделения целостных сущностей из облака разрозненных рецептивных полей

такого выделения не происходит потому как на уровне примитивов никакое "сущности" не выделяются. Любой примив может оказаться критически важным признаком восприятия.

>>Как достигается инвариантность к положению/угловому размеру объекта.

это - так же тривиальный вопрос, хорошо изученный на уровне нейрофизиологии. Для каждого угла и размера формуруется свой распознаватель данного примитива. На их основе формируются распознаватели более сложных сочетаний признаков данного вида сенсорики (в первичных зонах мозга) и сочетания разного вида сенсорики (для вторичных зон). Распознаватель, что это именно треугольник среди всех видов масштаба, цвета и наклона треугольников, как правило, бывает менее необходим, чем распознаватель другой геометрической фигуры для целей адаптивности и задача их классификации - уже высокоуровневая реализация в третичных зонах мозга. Но возможны распознаватели и такого рода - на основе примитивов, например, всех линий разной толщины и наклона. Все это - иерархия усложняющихся от примитивов до более сложных распознавателей, построенных по принципу однослойного персептрона. Модели таких распознавателей  описаны в Алгоритмы сознания 2.

Айк 18.09.2012 15:39

Nan, ты ведь наверняка пробовал реализовать предложенный "алгоритм", насколько я помню, у тебя были даже какие-то патенты. С какими трудностями ты столкнулся при реализации?

nan 18.09.2012 19:06

Пытался протолкнуть проект, на который в то время нужно было по прикидкам около 4 мегабаксов. Не выгорело. Делать такие вещи на коленках (на компе, пусть и очень крутом) считаю безнадежным.