автор: Айк сообщение № 48013: |
но вам тогда прийдётся мастерить из LLM полноценного агента |
Если уж подключать к проекту нейросети, то правильнее было бы создавать с их помощью симуляторы реальности, в которые запускать Beast и пусть он пытается там адаптируясь выживать, что означает активацию поискового, пищевого, оборонительного, агрессивного и репликационного поведения. И тогда можно было бы моделировать эволюцию, проверяя и создавая адаптивные механизмы, не тратя на это миллионы лет.
Суть проекта - не создать максимально достоверную симуляцию какого то животного, а проверить правильность компоновки и последовательность развертывания адаптационных механизмов в процессе формирования живого субъекта. Ведь главная загадка жизни и разума - не то, как это работает, а как это появилось. И тут только эксперимент, имитирующий процесс эволюции, способен дать богатый материал для осмысления, а для этого должна быть теория, объясняющая принципы построения живых самоадаптирующихся систем.
Мы пытаемся подстегнуть интерес в этом направлении, предлагая прототип такой системы, которая последовательно, по стадийно, начинает разворачиваться от простейшего рефлекторного бессмысленного реагирования к осознанному. Это не Лунтик, который вылупившись из яйца сразу способен к осознанному реагированию. В реальности такого нет. Чем сложнее животное, тем примитивнее и беспомощнее у него детеныши. И на это есть причины.
Чем ниже стадия – тем более примитивны механизмы обучения. Потому, что чем проще механизм – тем он надежнее и стабильнее результат. И если надо уверенно закрепить базовые навыки, то эффективнее это делать на более низком уровне развития более простыми механизмами. Даже если при этом образуются лишние, заблокированные в процессе обучения реакции.
На начальных стадиях 1, 2, 3 автоматически активируется игровой режим обучения, когда Beast не реагирует изменением состояния на эффект действий кнопок, иначе образуется много неадекватных автоматизмов. Но в 4 стадии добавляются более продвинутые механизмы обучения, которым уже нужен переход из одного состояния в другое при действии кнопок, что является естественной реакцией. Поэтому игровой режим в 4 стадии активируется произвольно специальной инфо-функцией (это пока еще не реализовано). Однако если нет базовых автоматизмов, на основе которых строятся более сложные, то попытка их создать в 4 стадии в обычном режиме приведет к еще большим негативным эффектам, чем в предыдущих. Здесь уже более отчетливо проявляется правило: чем проще автоматизм, тем на более низкой стадии он должен быть создан.
В данной версии реализации живого существа Beast существенно упрощена реализация двух механизмов, по причине их не принципиальности в плане точного соответствия реальным. Достаточно просто самого результата их работы. Это:
- Способность распознавать простейшие примитивы в стимуле
- Способность точно воспроизводить стимул – отзеркаливать внешние действия
В реальности, детеныш не создает вербальные сенсоры сразу же в виде точных распознавателей, а формирует сначала множество ошибочных, из которых статистической обработкой выделяет наиболее вероятные, которые не обязательно 100% правильные. При этом новые сенсоры создаются с учетом уже сформированных, например, если вместо звука «а» распознался и зафиксировался сенсор «я», то уже на слоги «ма» будут формироваться сенсоры «мя». Вот почему так сложно избавиться от акцента, изучая иностранный язык.
Еще более сложная проблема в природной реализации – повторить действие. Тут мало того, что нужно корректирующими рефлексами мозжечка правильно составить последовательность действий с нужной энергичностью, что делается не с первого раза, так и сами воспроизводимые действия не точны изначально, потому как распознаватели не точны. И кроме того, успешность повтора так же не точно оценивается. То что последствия после действия стали лучше, вовсе не значит, что действие точно такое, какое должно быть – оно может быть просто похожим и примерно допустимым.
В итоге получается, что в реальности, в первую очередь по причине невозможности точно отзеркалить внешний стимул, не возможны схемы обучения, которые рассмотрены для 1, 2, 3 стадий. Это идеальные условия, которые в реальности не возможны в принципе. Именно наличие вышеописанных проблем и приводит к тому, что из всей массы вариантов реагирования на стимулы в начальных стадиях в итоге фиксируются только простейшие реакции, как наиболее легко воспроизводимые и статистически устойчивые. А мы это просто повесили на Оператора.
Однако в программной реализации нет никаких проблем точно воспроизвести стимул – и нет проблем даже на 2 стадии создать любые автоматизмы, хоть со словами, хоть с фразами и предложениями. Что изначально приводит к «химеризации» Beast. Программная реализация – это всегда построение существа иными, не природными средствами, но для развития эффективности адаптивных механизмов используются те же, что в природе, принципы. Программное существо имеет свое право на существование, как альтернативная конструкция, по многим свойствам не похожая на реальные био-конструкции и многие возможности в программной реализации несопоставимо выше, чем в природной, как если сравнивать природный глаз и фотоаппарат.