В природе эволюционно сформировалась общая для всех живых существ модель реализации адаптивного поведения, т.е. поведения, которое необходимо корректировать в зависимости от новизны условий, в которых старый алгоритм реагирования может оказаться неприемлемым по своим результатам.
В статье предлагается модель, которая использует, видимо единственный принципиально метод определения: можно ли полагаться в новых условиях на существующий алгоритм реагирования или его необходимо скорректировать для этих условий. Но при этом реализация принципа адаптивности предлагается не только на основе нейронных сетей из дискретных элементов - распознавателей (1 нейрон - 1 распознаватель) [26], но с компромиссным использованием компьютерных элементов обработки, что делает практическую реализацию намного более достижимой технически.
Статья - новый вариант отдельной специфики из более детализованного изложения Совершенствуем природную реализацию принципа адаптивного поведения. Побочным эффектом статьи ожидается возможность более ясного понимания организации адаптивного поведения.
В природе механизм адаптивности реализуется как дополнительный апгрейд жесткой по функциональности нейросети с наследственно предопределенным алгоритмом, характерной для простых насекомых. Этот процесс усложнения, для целей не только наследственной, но и индивидуальной адаптивности к изменяющимся условиям, прослежен в статье Эволюция механизмов сознания. Апгрейд заключается в том, что, помимо наследуемой жесткой функциональности нейросети, возникает и совершенствуется способ определения критериев изменения условий реагирования, прогностического нахождения кажущегося более удачного варианта реагирования и оценки результата опробования этого варианта в реальности. Механизмы апгрейда можно назвать одним словом: это - механизмы осмысления происходящего, механизмы реализации сознания [123].
Досознательная организация жестко наследуемого алгоритма включает в себя наборы иерархически усложняющихся распознавателей, специфичных для каждого вида рецепции (зрительной, слуховой, обонятельной, вкусовой, осязательной, рецепторов состояния мышц и сухожилий, рецепторов гомеостаза и состояния внутренних органов). Специфичные каждому виду рецепции наборы, усложняющиеся на основе более простых, распознавателей образуют условно так называемые первичные зоны мозга. Наборы распознавателей, использующих сигналы специфичных распознавателей различных видов, располагаются во вторичных зонах.
С другой стороны (не со стороны рецепторов - восприятия, а со стороны эффекторов - действия), так же образуются наборы распознавателей тех или иных примитивных действий, от самых элементарных (отдельные мышечные волокна и другие эффекторы регуляций) до более сложных составных реакций. Рецепторные распознаватели связываются с эффекторными - в третичных зонах, - в виде сложных распознавателей, составляющих связанные цепочки отдельных поведенческих реакций, которые так же имеют иерархию усложнения от самых простых до сложных на основе более простых. Эта связь осуществляется с помощью специального типа рецепторных распознавателей, которые определяют текущее состояние организма и поэтому могут использоваться для запуска или остановки отдельных поведенческих цепочек. Этот вид рецепции состояния организма и определяет необходимость (потребность) в тех или иных действиях в зависимости от текущего отклика рецепторных распознавателей.
Для того, чтобы такой принцип регуляции поведения оказался более приспособлен к некоторым наиболее типичным условиям, которые определяют необходимость определенного стиля поведения (оборонительное, половое, пищевое и т.п.), в природе возник механизм нейромедиатороной регуляции [22], когда в зависимости от того какой тип нейромедиатора преобладает в мозге, могли связываться лишь те распознаватели в третичной зоне мозга, которые в своих связях используют этот нейромедиатор для передачи возбуждения.
Такая система поведенческой регуляции способна к организации любого сколь угодно сложного поведения [63], но она наследственно предопределена и не имеет механизма достаточно быстрого создания новых алгоритмов (вариантов) поведения, если старые оказываются не подходящими в изменившихся условиях.
Для большей полноты картины стоит сказать, что последовательность развития наследственно предопределенных структур нейросети позволяет реализовываться или оставаться нереализованными отдельным взаимосвязям - в зависимости от актуальности их в условиях развития организма и тем самым реализуют более пластичную адаптивность особи. Самые же последние по срокам созревания взаимосвязи остаются у сложных насекомых наиболее пластичными и способны видоизменяться в течение жизни одной особи, создавая предпосылки к более гибкому апгрейду адаптивности.
Реализация на уровне наследуемо предопределенной структуры технически вполне достижима уже сегодня и во многом реализуется практически в виде нейросетей по принципу персептронов [26]. Технология искусственных нейросетей довольно изощренно отработана (хотя во многом реализуется с изъянами понимания - как целостно обучаемая нейросеть, вместо последовательного обучения в виде отдельных, локальных систем все более усложняющихся распознавателей). Поэтому вариант моделирования с поочередным развитием и специализацией распознавателей восприятия и действия - вполне осуществим, мало того, возможно создание заранее специализированных наборов, обеспечивающих эффективное восприятие для заранее предполагаемой специфики использования.
Главная идея апгрейда - вполне понятна: если раньше в определенных условиях какое-то действие приводило к удовлетворению потребностей (пока еще не применимо понятие "желаемости" результата!), то условия могут измениться настолько, что теперь это же действие приведет к отклику рецепторов, определяющих состояние организма - как аварийное состояние. Поэтому, в первую очередь необходимо определить, что предполагаемое (потребностями) действие выполняется в условиях, которые в значимых деталях отличны от прежних, т.е. в текущем восприятии, сфокусированном на выделяемых распознавателями признаках условий, критичных для выполнения действия (т.е. составляющих профиль возбуждения распознавателя данного звена цепи действия), появилась что-то новое.
В ранее сформированной поведенческой цепочке, которая реализует потребность, доминирующую по силе среди всех других потребностей, в звеньях (фазах) цепи, когда пусковой стимул [308] актуальности действия запускает очередную фазу цепочки, действие выполнялось ранее при вполне определенных сопутствующих признаках условий (активны те распознаватели признаков восприятия, что связывались с данной фазой поведенческой цепи вместе в признаками потребности, подвозбуждая ее актуальность и делая возможным действие). Если этих признаков восприятия не окажется, то действие вообще может не выполниться (т.к. распознаватель актуальности фазы не возбудится), что соответствует тому, что контекст условий ([232], [279]) полностью не соответствует данному действию.
Но если изменились только отдельные признаки (отсутствуют некоторые или добавились новые), а общее подвозбуждение позволило бы осуществить действие с пусковым стимулом, то, возможно, что изменившаяся картина совокупности признаков может послужить предупреждением, что старый вариант поведения уже не приемлем для таких условий.
Поэтому достаточно иметь возможность фиксировать степень новизны, чтобы на ее основе судить насколько вероятна неприемлемость результата. И эту степень новизны достаточно оценивать лишь по той совокупности признаков, которая связана с данной фазой действия. В самом простейшем случае признаком новизны может послужить недовозбужденность распознавателя данной фазы движения [141]. Но более точно это способен выявить дополнительный распознаватель, который ранее был связан с данной фазой и зафиксировал совокупность признаков, сопровождающий данную фазу - образ восприятия. Если в последующем появляется рассогласование между возбужденной совокупностью признаков и запомненным следом прежней совокупности, то это и будет сигналом новизны.
Итак, механизм апгрейда, при каждом акте проверки на новизну текущей фазы реализации наиболее актуальной потребности, должен обеспечивать создание вспомогательного распознавания - памяти об этом акте, что в реальности и осуществляется при каждом акте осознания в виде служебной цепочки, фиксирующей последовательности касаний механизма проверки новизны значимой фазы. Это и есть механизм сознания [249].
В результате возникают мыслительные цепочки воспоминаний об осознаваемых событиях, которые, точно так же как и цепочки поведенческих автоматизмов, могут быть активированы при достаточной актуальности (потребности) в этом, порождая осознаваемые воспоминания, которые могут использоваться при мышлении - творческом [219] процессе сопоставления схожих воспоминаний и прогностической [33] выработки предположений о результатах новых вариантов поведения.
Стоит отметить, что следы осознания содержат образы восприятия, которые способны удерживать этот субъективизированный образ [87] (связанный с личным отношением) для процесса его творческого осмысления (см. Субъективизация ощущений и личность). Конечно, использование как бы дублирующего распознавателя, специализирующегося при акте осознания для функции детекции нового - лишь случайно удачная эволюционная находка в более общем механизме образования и специализации новых распознавателей из созревающих в данном периоде развития нейронов. Кроме того, они не только обеспечивают функции детекторов нового, но и способствуют привлечению внимания к отдельным фазам поведенческих автоматизмов при вспоминании и в корректировках поведения не в зависимости от новизны условий, а в произвольных усилиях, обусловленных потребностью, вызванной предположительной субъективной желаемостью результата, в отличие от потребностей, вызванной рецепцией состояния организма.
Сейчас трудно сказать как именно это происходит без дополнительных исследований. Но то, что, помимо собственно цепочек поведенческих автоматизмов формируются цепочки последовательностей актов осознания, которые при воспоминании способны "проигрывать" это как фильм в виде субъективизированных образов в точности так же, как это ощущалось при осознании - не вызывает сомнения. А наличие таких цепочек сложно обеспечить на уровне тех же нейронов, формирующих цепочки поведенческих автоматизмов (потому, что последовательность переключения их активности определена закрепленными связями, а ветвление мыслительных цепочек соответствует не последовательности поведенческого акта, - а последовательности определения наиболее значимого и нового среди всех одновременно выполняющихся цепочек автоматизмов). Самое важное здесь - не точность копирования способа реализации в модели, а принципы, обеспечивающие назначение апгрейда - адаптивность к новому. Поэтому можно выбрать такие методы технической реализации, которые обеспечат это наиболее удобным и эффективным образом.
Итак, задача: в момент реализации поведения для удовлетворения наиболее доминирующей потребности (наиболее сильный отклик системы распознавателей значимости [15], поддерживающих текущие выполняемые автоматизмы) нужно отслеживать новизну в профилях признаков условий, закрепленных за теми же фазами выполняемых автоматизмов и в случае появления достаточно большой новизны "на лету" (не прерывая выполнения) анализировать, насколько это может привести к (не)желательным последствиям (прогностическими подвозбуждениями по цепям старого опыта [207]), и выбирать одну из трех реакций: 1. игнорировать, 2. оперативно изменять направление выполнения автоматизма - если прежний опыт для такого изменения условий уже сформировал нужное ветвление или 3. если время позволяет, остановить выполнение действий для того, чтобы выработать более приемлемый вариант, а если не позволяет, рискнуть поступить как раньше и получить опыт такого решения [143].
Если организовывать цепочки автоматизмов в виде программ отдельно используемого для этой цели процессора (1 процессор для 1 цепочки), то нагрузка процессора в режиме реального времени может быть вполне допустимо невысокой. Сколько цепочек - столько процессоров со своей адаптируемой к новому программой, с возможностью подключения новых процессоров для создания новых цепочек (- по определенному критерию).
Отдельно должна быть организована система, которая так же обеспечивает отработку другого множества цепочек, но уже - мыслительных автоматизмов, предназначенных для накопления навыков выработки новых вариантов поведения, т.е. творчества. Эта система и будет подключаться через специальный коммутатор попеременно для контроля к наиболее актуальной, доминирующей среди других потребности, инициирующей поведение.
При этом образы восприятия, ассоциированные с фазами поведенческого автоматизма, сопоставляются с ассоциированными фазами соответствующих мыслительных цепочек, сохраняющих последние зафиксированные актом сознания профили (сочетания) признаков условий (память образа). При прерывании фазы автоматизма в случае необходимости осмысления, образ признаков восприятия поддерживается в активном состоянии уже не внешними рецепторами, а системой сознания, с созданием (если еще нет) или корректировкой распознавателя этого образа, сохраняющего текущий профиль возбуждения (в природной реализации это соответствует условиям образования новых связей). Мыслительный распознаватель сохраняет память образа фазы поведения и способен возбудить его при вспоминании и поддерживать возбужденным даже если к нему не подключена система сознания. С другой стороны, этот распознаватель связан с системой отношения [15], фиксирующей результат реального опыта пробного поведения при осознании, что обеспечивает реализацию субъективных потребностей, т.е. желаемого или избегаемого (в отличие от потребностей, инициируемых распознавателями состояния организма). Мыслительные образы оказываются субъективизированными, т.е. связанными со значимостью [125] того, что в данных условиях представляет собой текущий образ. Это обеспечивает активацию нужных мыслительных образов точно так же, как распознаватели потребностей активируют образы для запуска цепочек поведенческих реакций.
В итоге имеем два вида автоматизмов: 1. древняя реализации в виде алгоритмов поведения - для удовлетворения потребностей организма и 2. новая реализация - в виде алгоритмов мышления - для удовлетворения субъективно обусловленных потребностей.
Организация обоих видов автоматизмов (со способностью корректировки) аналогична и следует хорошо изученному принципу действия цепочки поведенческого автоматизма, организованному как последовательность звеньев (фаз) отдельных составляющих актов поведения, активирующихся в зависимости от набора признаков восприятия и признаков потребностей (которые в совокупности подвозбуждают всю цепочку), и дополнительно - пусковыми стимулами, определяющими актуальность активизации последующего звена цепи (или специфический внешний признак или сигнал проприорецепторов (в самом широком смысле - для мыслительных цепочек) о том, что предыдущая фаза отработала).
Итак на основе представлений о природном варианте реализации была сделана попытка лаконично изложить суть принципов формирования нового поведения в изменяющихся условий и то, как это можно было бы реализовать технически. Возможно, в последующих статьях будет детализация отдельных специфических особенностей реализации и(или) скорректирован текст данной статьи.
Дополнительно:
· Совершенствуем природную реализацию принципа адаптивного поведения
· Эволюция механизмов сознания
· Организация механизмов психики
| ||||||||||||