Книгу прочел.
Сорри, за кажущуюся безапелляционность, это – всего лишь мое мнение.
Биологи, к сожалению, ещё не скопировали ни одной схемы нервной системы, по которой
можно было бы построить её работающую модель.
Уже формализовано немало полных схем простейших насекомых, которые показывают основополагающие принципы нейронной организации и взаимодействий. По тексту книги я убедился, что вы недостаточно полагаетесь на накопленную базу фактических данных исследований нейробиологии, т.е. пытаетесь разобраться во всем с нуля силой одной только своей интуиции, которая, надо сказать, демонстрирует хороший здравый смысл, но ей так не хватает знаний методов и принципов, обкатанных природой в невообразимом числе попыток. Вот наиболее важные факты исследований, систематизированные по тематикам: аксиоматика. Просто необходимо полагаться на имеющуюся систему аксиоматики, а не пытаться создать все с нуля.
На самом деле истинным обучением можно назвать только обучение, которое
связано с нахождением новой стратегии поведения, которой раньше не существовало у животного. Такое обучение присуще только высшим животным, у которых очень сложная организация мозга.
Мысль о сути обучения нахожу здравой, но не верно утверждение, что такое обучение присуще только высшим животным. Есть несколько пластов эволюционного совершенствования механизмов индивидуальной адаптивности. И первые механизмы есть уже у виноградной улитки.
Обучение подразумевает изменение поведения в типичной ситуации. Значит, до обучения уже какое‑то поведение было. И это поведение было удовлетворительным (до некоторых пор). Поведение нужно менять, когда оно становится неудовлетворительным, то есть перестаёт удовлетворять каким‑то требованиям (перестаёт находить НДУ , нет подтверждения РаботоСпособности и т. д.).
Тоже есть здравый смысл, но как бы упущено главное: в каких именно случаях оказывается нужно менять поведение. Это – появление новых условий, в которых наработанные удачные реакции приводят к нежелательным последствиям. Для старых условий ничего менять не нужно.
Критериев, по которым может меняться поведение робота, всего два. Первый: сохранение РаботоСпособности контролируемого механизма.
Второй: повышение Эффективности Производства Продукта.
Критерий только один: приводит ли старя реакция к желательному результату (для самого первого уровня: восполняет ли она, в конечном счете, негативные параметры гомеостаза). Когда жизненный параметры выходят из нормы, становится “плохо”, точнее, включаются контексты, в которых наработаны реакции восстановления этих параметров. Если эти реакции приводят к ухудшению, то стереотип должен быть заблокирован, пока для данных новых условий не выработается более удачная реакция.
Анализатор Причины снижения Эффективности диагностирует нарушение тех
или иных НДУ , без которых работа контролируемого механизма неэффективна
либо невозможна. Результаты диагностики передаются Механизму Принятия Решения (МПР ), который выбирает из набора готовых решений тот инструмент,
который способен восстановить утраченные НДУ , обеспечивающие РаботоСпособность механизма.
Этим затронуты механизмы произвольности – высший увень адаптивной регуляции, для реализации которого пока нет никаких оснований.
По бокам Тачки находятся две антенны с датчиками DT(2) и DT(3). Если один
из них пересечёт границу экрана, то сформируется признак пересечения гра-
ницы экрана PR(14) или PR(27).
Если Тачка подъезжает к краю экрана правым бортом, то сработает датчик DT(3)
и сформирует признак PR(27), который принимает значения либо «1», либо «0».
Этот признак поступает непосредственно на М отор Поворота НаЛево (МПЛ ), ко-
торый формирует отворот от З аграницы. МПЛ работает до тех пор, пока датчик
регистрирует наличие признака Заграницы. Аналогично срабатывает датчик
DT(2) и признак PR(14), поступая на М отор Поворота НаПраво, формирует отво-
рот от заграницы.
Это – типичный “игровой интеллект”, причем у сильно упрощенной функциональности. В переводе на физиологию – это – уровень безусловных рефлексов (наследственно предопределенных реакций). Конечно, этот уровень присущ всем живым существам любой сложности, но от того, как организованы механизмы этого уровня сильно зависит возможность наслоения более высокоуровневых механизмов адаптивности. Природа в своих бесконечно многообразных экспериментах прошла любые мыслимые (и возможные для биореализации) варианты, отсеяв все тупиковые и выйдя на в самом деле эффективные принципы. И очень стоит знать, в чем именно заключаются такие принципы.
Понятие «Потребность» пришло из физиологии, но в робототехнике широкого при-
менения не получило. Связано это, вероятно, с тем, что чёткого определения
этому понятию физиологи ещё пока не дали.
Физиологи дали, просто нужно достаточно полно погрузиться в эту предметную область. А в ИИ да, просто игнорируют гомеостаз. Но, оказывается, это – основа эффективной индивидуальной адаптивности всех уровней усложнения, не гомеостазе все построено как на самой значимой основе.
если возникает потребность что‑то менять, это означает, что где‑то что‑то не в порядке.
Потребность менять – относится к высшей психике. Есть потребность противодействовать выходу жизненных параметров из нормы и использовать сигнал возврата в норму – как обучающий быть данной реакции в данных условиях или нет.
Конечно, никакой робот или другое техническое устройство не способны получать удовольствие. Однако можно предположить, что удовольствие возникает
от удовлетворения мотивации, при условии, что мотивация — это заторможённая потребность. Тормозить потребность (тем самым переводя её в разряд мотивации) приходится в силу тех или иных причин на какой‑то период времени. В большей степени удовольствие — понятие психофизиологическое и возникает от того, что снимается расход ресурса, который расходовался на торможение и контроль над мотивацией.
Это – тот случай, когда нужно просто подсмотреть принцип, найденный природой, а не изобретать с нуля... И тут есть огромное число данных исследований, позволяющее вполне надежно определиться с этой основой адаптивных реакций. Не буду описывать то, что уже много раз описано.
Каждое действие, которое выполняется живым организмом, должно посылать ответный подтверждающий сигнал о своём правильном (или неправильном) завершении.
В идеале это было бы очень удобно, но в реале далеко не сразу оказывается понятна значимость последствий. Поэтому есть принцип формирования условных рефлексов, позволяющих выделить причины и следствия.
Формирование любого Действия должно подтверждаться Признаком Правильности Действия. Прогноз заключается в ожидании признака соответствия, успеха, подтверждающего то, что действие не вышло за рамки штатного режима (РСп).
Каждое действие совершается для того, чтобы получить от него некоторый ожидаемый ответ, эффект, прибыль, продукт и т. д. Однако не всегда совершённое
действие формирует ожидаемую ответную реакцию (эффект).
Речь, по сути, идет о личном опыте, когда можно подсмотреть, чем в прошлом заканчивалось действие и в каких условиях. Но далее идет непростой механизм сопоставлений и обобщений – далеко выше, чем уровень условных рефлексов. Это – уровень субъективных моделей понимания и произвольности. Об этом есть много материалов на сайте.
Если есть подтверждение (соответствие, продукт), то действие продолжается! В противном случае активируются Службы Безопасности.
Это – общий принцип адаптивной регуляции: то, что получилось удачно – впредь используется, что неудачно – блокируется. Критерии удачно и неудачно – свои на каждом уровне эволюционных усложнений.
Правильность, безошибочность совершаемого (текущего, штатного) действия должна постоянно подтверждаться: на предмет своего Успешного Завершения.
Если прогноз подтверждается (успешный ответ), то текущее действие — правильное и его изменять не надо.
На самом деле такого постоянного подтверждения нет: привычное совершается пока в каких-то новых условий такое действие оказывается неудачным. Вот тогда и возникает ветвление вариантов – уже для новых условий. Ветвление контекстов значимости – действия – очень важный принцип адаптивной регуляции.
Схема запроса Подтверждения
1. Для формирования нового или продолжения текущего действия нужно постоянно запрашивать разрешение-подтверждение, которое позволит его совершить.
2. Запрос о предполагаемом действии посылается в «вышестоящую инстанцию», где происходит анализ: соответствуют ли запрашиваемое действие и Внешняя Обстановка безаварийной, то есть штатной, работе.
3. Если действие не противоречит Внешнему образу, то выдаётся разрешение на совершение двигательного акта.
4. Если «вышестоящая инстанция» сочтёт, что при текущих Внешних Условиях запрашиваемое действие несовместимо, то эффектор блокируется и нужно подбирать другое действие.
Природа все сумела организовать принципиально проще, без такого постоянно подтверждения, что позволило ей перейти к в самом деле чудесным по эффективности уровням нахождения решений.
В робототехнике при разработке поведенческих схем используются некоторые понятия, заимствованные из физиологии, например автоматизмы и рефлексы.
Однако смысл в них вкладывается несколько иной. Рефлекс можно определить как действие, которое работает, пока есть раздражитель, так называемая ре-
активность. Когда раздражитель уходит, то и рефлекс прекращается. У рефлекса нет памяти, и сложной структуры. Автоматизм же имеет собственную внутреннюю триггерную структуру и не прекращается после ухода запускающего признака.
В данной интерпретации все эти термины (автоматизмы и рефлексы) не имеют никакого соответствия с природными механизмами и здорово теряют эффективность, например, при выяснении причины и следствий в условных рефлексах.
любое действие или решение вынуждено приниматься в условиях неполной информированности, тем более, когда действовать нужно быстро. Много рассуждающий человек пытается в своём анализе собрать максимум доводов «за» или «против» принятия решения. Неуверенный, сомневающийся человек редко берёт на себя ответственность в принятии важного решения.
Выделенное – святая правда (то, о чем теорема Геделя и то, о чем писал Р.Пенроуз)
для того чтобы машина была обучаемой, она тоже должна совершать ошибки! Обучение правильному поведению — это как раз и будет ответом на совершённые ошибки.
Вот это – не обязательно. Метод проб и ошибок – самая примитивная стратегия. Но это неизбежно во многих случаях.
Такие сложные понятия, как Сознание, Разум, Душа, не относятся напрямую к вопросам Обучения, однако рано или поздно каждый уважающий себя разработчик роботов (особенно автономных) задаётся такими вопросами, чтобы, по возможности, раскрыть секреты тех механизмов, которые управляют поведением человека. В дальнейшем ответы на эти вопросы помогут инженерам разрабатывать более сложные модели поведения для автономных роботов.
Конечно, никто не знает, что такое Сознание, сколько бы об этом ни писали в литературе и в И нтернете.
Понятие сознания – напрямую относится к уровню обучения в условиях новизны и значимости. Прежде всего речь идет об ориентировочном рефлексе, подключающим единственный канал осознанного внимания к наиболее актуальному в текущий момент для нахождения по возможности более верного варианта реагирования в таких условиях.
Я же рассмотрю этот вопрос с технической точки зрения, наделив Сознание определённой функцией, чтобы с её помощью разрабатывать новые схемы и механизмы. С технической точки зрения Сознание можно представить как функцию, позволяющую держать под контролем физиологические и поведенческие потребности организма с помощью другой функции — Терпения.
Терпение является инструментом Сознания, и Сознание управляет Терпением. Чем ниже уровень Сознания (точнее, ток, его обслуживающий), тем труднее контролировать терпение и выделять энергию на работу этой функции. Уменьшение уровня Сознания уменьшает способность Терпеть.
К сожалению, интерпретация неудачна по сравнению с тем, какой функциональностью наделяется сознание в природной реализации. Но это – очень большой и обширный материал для обсуждений.
3. Таким образом, снижение Сознания до нуля полностью отключает управление эффекторными механизмами.
Вовсе нет. При лоботомии (нет сознания) человек внешнее мало отличим от других. Просто он весь на уже имеющихся автоматизмах. Если отключить сознание дозой алкоголя, чел. тоже остается на рефлексах, правда они тоже затрагиваются.
4. Чем ниже Сознание, тем труднее выполнять работу, которую приходилось делать раньше. Сравниваются эффективности работы в различных состояниях.
Это – неверное утверждение. Автоматизм любой сложности не требует привлечения сознания, пока в новой ситуации он покажет свою несостоятельность. Чем более взрослый человек, тем меньше своих действий он контролирует сознательно.
6. Во сне Сознание отключается через естественные механизмы.
Тоже неверно. В течении нормального сна проходят 4-5 фаз с участием сознания на уровне оценки смысла происходящего.
>>мой метод построен на другом принципе. Кстати, ему не нужны высокопроизводительные машины.
Пока ты играешь с простыми стратегиями, да, не нужно, но попробуй сделать робота, с которым можно общаться перепиской.
>>По образованию я инженер электронщик, а не программист, поэтому все мои схемы состоят из компараторов, триггеров, мультивибраторов и т.д. Впрочем, всё работает! И метод своей работоспособностью подтверждает свою правильность.
т.е. программно эмулируются эти компоненты. А зачем? Ведь можно использовать все преимущества программной реализации без этого уровня эмуляции. И не создавать виртуальный мир, а взаимодействовать с реальным.
Общее резюме.
Автор книги – увлеченный человек, глубоко погрузившийся в область построения индивидуальных адаптивных систем. Но он это делает “с нуля”, без того, чтобы подсмотреть принципы, которые выработала природа на примере целой линейки постепенно усложняющихся систем вплоть до приматов. Это привносит большое число неверных предположений, которое превышает возможности разгрести такую кучу на протяжении одной жизни.
Если есть желание примкнуть к нашей группе в рамках нашей предметной области, то нужно некоторое время на наведение мостов понимания и, главное, на формирование достаточно согласованной общности в концепциях, что и позволило бы работать в одной области идей.