Поиск по сайту
Изданы 4 книги сайта Форнит (бумажные и электронные версии).
Научно-популярная: «Познай себя» и специализированная: «Основы адаптологии».
Литературно-художественная интерпретация: двухтомник «Вне привычного».
Короткий адрес страницы: fornit.ru/7610
Содержание журнала Достижения науки, техники и культуры
Ссылка на первоисточник статьи: https://www.popmech.ru/technologies/news-392552-novyy-ii-google-pereshel-na-samoobuchenie/.

Новый ИИ Google перешел на самообучение

На этой неделе компания DeepMind рассказала о новом прорыве: искусственном интелекте AlphaGo Zero. Его предшественник, AlphaGo, учился у людей и выигрывал лучших игроков в го. Версии Zero люди не нужны.
ИИ AlphaGo учился играть в го, разбирая тысячи любительских и профессиональных партий, сыгранных людьми. ИИ, пришедшему следом за ним. не нужно учиться у людей: он разбирает возможные комбинации и ходы абсолютно самостоятельно.

И самообочение сделало его лучше. Из сотни игр, сыгранных с предшественником, AlphaGo Zero не проиграл ни одной. Ни одной! В отличие от AlphaGo, у Zero всего одна нейросеть вмсто двух, но и этого хватило.
На то, чтобы освоить игру, у Zero ушло всего три недели, в которые уместилось такое количество партий, на которые человеку потребовалось бы несколько тысяч лет.

Разработчики AlphaGo Zero призывают не бояться его устрашающих способностей. По словам одного из специалистов DeepMind, Ника Хинса, ИИ лучше человека играет в древнюю китайскую игру, но в других областях не блещет: он был построен для решения узкого круга задач.

Описание AlphaGo Zero опубликовано в Nature.

Через 21 день разработка DeepMind приблизилась к уровню AlphaGo Master — онлайн-версии, которая в 2017-м победила топ-60 сильнейших игроков в го, включая чемпиона мира Ки Джи во всех 3-х партиях. А 40 дней спустя AlphaGo Zero обыграла все свои ранние инкарнации, став самым совершенным алгоритмом. Когда новому ИИ дали сразиться с версией AlphaGo 2016 года, его противник был разгромлен со счетом 100:0.

Если AlphaGo Lee училась на ходах профессионалов, то "самоучка" Google на начальном этапе располагала только самыми базовыми правилами игры, пишет The Guardian. Она играла сама с собой миллионы раз: перед каждым ходом алгоритмы анализировали позиции фигур на доске и вычисляли оптимальное решение, которое с самой большой вероятностью может привести к победе. После игры нейросеть обновлялась, чтобы в следующей партии сразиться с более сильной версией себя.

Комментарии представителей сайтов-участников nan:
Итак, достигнут уровень организации контекстных рефлексов (условных рефлексов), но, с одной стороны намного с большим быстродействием и совершенно иной организацией механизма, а, с другой стороны, ограниченный лишь правилами игры в го, которые заменили систему значимости отклонения параметров гомеостаза и возврата их в норму. Т.е. все подкрепление и избегание ограничено пока узкими заданными правилами.

Обсуждение Сообщений: 2. Последнее - 20.10.2017г. 17:53:21


Оценить статью >> пока еще нет оценок, ваша может стать первой :)

   
Архив новостей
Анонсы новостей сайтов-участников    http://www.scorcher.ru/xml/news.rss - что это?
Достижения и недостатки при Путине
Обобщение доступных статистических материалов динамики параметров развития России с 2000 по 2017 годы:
Достижения и недостатки при Путине.
03-11-2017г.

Системное мышление и формализация
В статье показано, что такое системная модель и почему не системное исследование дает бессмысленные результаты:
Системное мышление и формализация.
24-09-2017г.

О демократии и либерализме
Надеюсь, что статья не будет красной тряпкой для верных Идее либералов и демократов, а послужит поводом для переосмысления многих интересных социальных проблем: О демократии и либерализме.
12-09-2017г.

Смерть и адаптивность
Более общим, чем естественный отбор, для личности является понятие своевременности и своеместности существования - хронотоп личности:
Смерть и адаптивность.
12-07-2017г.

Дети и политика
Что вырастит из ребенка: носитель чужих идей (робот), просто проживающее свою жизнь быдло или самобытный человек, сформировавший свое личное мнение по самым важным именно для себя вопросам: Дети и политика.
18-06-2017г.

Эвристика вероятности
Сегодня существуют методы, позволяющие даже в случае минимального жизненного опыта оценивать, насколько вероятно, что вам врут партнеры и близкие, насколько уверенно можно допускать зависимость между явлениями, в том числе, казалось бы, совершенно не связанными: Эвристика вероятности.


27-05-2017г.

Модели понимания и зависимость
В статье рассмотрена особенность субъективных моделей, негативная для адекватности понимания - зависимые состояния: Модели понимания и зависимость.
16-05-2017г.

Ненависть к несправделивости
Ненависть настолько сильное чувство и настолько имеет далеко идущие последствия, что стоит разобраться в этом психическом явлении: Ненависть к несправделивости.
19-04-2017г.

КПД политических революций
Насколько приемлемой для социума является политическая революция, суть которой многие апологеты ее необходимости для развития маскируют в самые различные формы:
КПД политических революций.
06-04-2017г.

Система произвольной адаптивности
Ясно и просто показываются принципы образования и взаимодействия функциональных элементов, присущих сознанию: Система произвольной адаптивности.
01-04-2017г.

Яндекс.Метрика
 посетителейзаходов
сегодня:22
вчера:22
Всего:6773