Почему современных математиков называют шаманами, о чем думает искусственная нейросеть и какое отношение имеет проблема Больших данных к племенным курам — об этом "Огоньку" рассказал известный ученый, специалист в области информационных технологий, ректор Сколковского института науки и технологий, председатель ученого совета ИППИ РАН, академик РАН Александр Кулешов
Данное интервью продолжает совместный медиапроект "Огонька" с Институтом проблем передачи информации им. А.А. Харкевича РАН "Математические прогулки". "Огонек" уже публиковал беседы с математиками Михаилом Гельфандом (
— Александр Петрович, вы как-то назвали себя математиком, переучившимся в инженера, поэтому хотелось бы поговорить о том, как современная математика воплощается в прикладных вещах.
— Знаете, сегодня математику не так просто разделить на прикладную и фундаментальную. Сам Андрей Николаевич Колмогоров, ведущий математик второй половины ХХ века, открыл ворота для громадного количества работ в прикладных областях. Он работал в сферах сложности теории вероятности, математической статистики, теории информации, которые прикладными никак не назовешь, но в итоге из этого образовалась, например, теория кодирования, без которой немыслима вся современная электроника.
— Тем не менее, когда говорят о современной прикладной математике, чаще всего в голову приходит так называемая проблема Больших данных: человечество накопило гигантский объем информации и теперь пытается это как-то использовать.
— Прежде всего давайте определимся, что называется Большими данными. С подачи господина Обамы это стали воспринимать именно как накопление информации (в 2012 году президент США выделил 200 млн долларов на исследование этой проблемы.— "О"). Но на самом деле речь идет о новых способах обработки этой информации и извлечения из нее знаний. Вот здесь в последнее время произошли поистине революционные изменения.
— Можно привести какой-нибудь революционный пример?
— Пожалуйста: только что завершился проект ImageNet, который делали китайцы на деньги Стэнфордского университета. Они собрали гигантскую базу данных, которая содержит 14 млн изображений, разбитых на 22 тысячи классов,— растения, животные, пагоды, реки и т.д. Затем они подписали каждую из этих картинок, что, согласитесь, совсем нетривиальная история, и теперь на основе этих данных создаются программы, которые могут опознать любое изображение на фото, которое предложишь. При этом, заметьте, если человек, выполняя подобную задачу, ошибается в 5 процентах случаев, то программа — в трех с половиной, то есть она уже что-то делает лучше, чем человек.
— Это какой-то важный порог для человечества?
— Безусловно. Ведь произошла совершенно удивительная вещь: появилось то, что впервые можно всерьез назвать искусственным интеллектом. Раньше все были убеждены: нет ничего такого, что мог бы сделать компьютер, но не мог бы сделать человек, если бы имел достаточно времени. А вот сегодня, к сожалению, это уже не так. Начало воплощаться будущее, которое мое поколение представляло по рассказам Айзека Азимова, Рея Брэдбери, а молодежь — по фильму "Терминатор". То, что еще лет 10-15 назад казалось абсолютной научной фантастикой, сегодня вдруг оказалось совсем близким. Мы уже живем в некой новой реальности.
— А в чем эта новая реальность проявляется? Ведь мы представляем будущее наполненным человекоподобными роботами и летающими машинами.
— Знаете, еще 20 лет назад мы ни в каких фантастических проектах не могли себе представить мир мобильного интернета и социальных сетей, в котором живем сегодня. Сейчас происходит примерно такое же по значимости изменение, которое мы пока еще сами не осознали. Это связано с тем, что из нашей жизни в скором времени полностью исчезнет такое понятие, как приватность. Грубо говоря, любой человек в любой момент времени будет знать, где вы находитесь и что делаете.
— Вы имеете в виду работу спецслужб?
— Ни в коей мере! Это происходит само по себе. Приведу простой пример: у меня сегодня был назначен завтрак в гостинице "Москва". По дороге на Красной площади я прошел мимо группы китайцев, которые фотографировались, случайно засняли меня и тут же выложили фото в Сеть. Представьте себе, уже сейчас она сама может опознать человека, изображенного на фото в любом ракурсе, и сообщить в соцсеть, где он, этот человек, находится. Говоря иначе, ты нигде не можешь спрятаться, потому что не знаешь, где и какой китаец тебя сфотографирует. Некое созданное единое информационное поле, в котором тебя очень легко найти и отследить, уже сейчас живет своей жизнью. Человечество на самом деле не отдает себе отчета, какого джинна из бутылки оно выпустило.
— Распознавание изображений, образов связано с работой так называемых нейронных сетей — некоторых компьютерных алгоритмов, которые, насколько я понимаю, "умеют" сами себя обучать. Можете рассказать, как устроена их работа?
— К сожалению, нет. До сих пор математического объяснения работе нейронных сетей не существует. Грубо говоря, мы не понимаем законов физики, которые задействованы в их работе. И сейчас, по сути, среди самых талантливых математиков во всем мире объявлен негласный конкурс на то, кто первый объяснит, как все это устроено. Многие математики рассматривают это как главный вызов в своей жизни.
— Значит, ученые создали нечто такое, что сами не могут объяснить?
— Да, удивительная вещь, но в этом отношении мы вернулись в XVI век, когда ученые наблюдали какой-то эффект, но не могли его объяснить. Человечество не сталкивалось с подобным, наверное, со времен Галилея. Это касается нейронных систем, так называемых систем Deep learning — глубинного обучения, и так далее.
— Но все же есть какой-то принцип, который лежит в основе этих систем?
— Есть некоторый подход, основанный на работе сетей с большим количество уровней, которые некоторым таинственным образом умеют тренироваться. Мы вводим туда определенный объем информации, они каким-то образом его обрабатывают, выделяют в нем важные вещи и выдают некий новый продукт. Сам этот процесс обучения на самом деле достаточно мистический, потому что непонятно, как это происходит. Там, внутри, конечно, работают некоторые математические алгоритмы, в том числе оптимизационные и тому подобные, но как в целом устроен процесс, мы не понимаем. В мире есть математические гуру, которые умеют создавать настоящие нейронные сети. Это похоже на кулинарный рецепт наших бабушек, которые всего добавляли по щепотке на глаз, но на словах не могли объяснить, как же варить щи.
— Что это за люди?
— Западные математики между собой называют их шаманами. Их всего несколько человек в мире, и это, без преувеличения, самая востребованная и самая высокооплачиваемая сегодня категория людей. Они умеют делать так, что нейросеть начинает думать. Среди лидеров направления — Джошуа Беньо (Монреальский институт изучения алгоритмов), Ян Лекун (руководитель Центра изучения данных при Нью-Йоркском университете), Алекс Крижевский (Университет Торонто). Это, безусловно, самое интересное, что сейчас творится в области прикладных вещей.
— Вы упомянули о Deep learning — глубинном обучении, которое позволяет работать этим самым нейронным сетям. В этой области тоже можно ждать прорыва?
— О, это направление сейчас очень популярно. Эти методы начали применяться повсеместно, и я бы даже назвал это неким локальным сумасшествием. По всему миру, в том числе и в Москве, существуют клубы любителей Deep learning. Это многих привлекает, потому что внешне кажется несложным. Суть такая: вы задаете машине некий объем информации и она сама решает, что с ним делать. Например, мой аспират подсунул компьютеру "Войну и мир" Льва Толстого и "Тихий Дон" Шолохова. В итоге через какое-то время Сеть начала производить свой текст, в котором практически не было грамматических ошибок, при том что никаких правил орфографии и синтаксиса ей никто не "объяснял". Она сама поняла, как надо, и если ее не остановить, она будет писать текст вечно, не останавливаясь.
— А есть в этом тексте смысл?
— Знаете, когда начинаешь читать, то лишь через пару страниц понимаешь, что смысла там нет, хотя написано все складно. Помню, там Пьер Безухов спрашивает графа Болконского: "Слушай, ты давно с Новочеркасска?"
— Такие вещи выглядят, безусловно, интересными, но вряд ли в них будут вкладывать гигантские деньги...
— Я до сих пор рассказывал о применении нейросетей для вещей более или менее тривиальных, бытовых. А на самом деле для них есть огромное количество чисто инженерных применений. Представьте, что сегодня инженер во всем в мире в среднем 80 процентов своего времени тратит на поиск аналогов. Проектирует он, предположим, некий редуктор или профиль самолета. Сначала он будет искать аналог, чтобы потом внести в него какие-то необходимые изменения. Это совершенно разумно, потому что глупо каждый раз все разрабатывать с нуля. Где же искать эти аналоги? В огромных базах данных, в электронных библиотеках, куда другие инженеры складывают свои решения. Весь вопрос в том, как там найти что-то подходящее. Оказывается, что это вполне решается методами нейросети, которая может научиться искать то, что необходимо.
— И это всерьез изменит работу инженера?
— Не то что работу инженера, а в каком-то смысле может совершенно грандиозным способом изменить картину мира, потому что позволит людям непрофессиональным или не совсем профессиональным делать довольно непростые вещи. Например, если сейчас любой новичок может распечатать себе на 3D-принтере расческу, то скоро он сможет сделать с помощью нейросети детальный чертеж дачного домика или еще что-то подобное. Исчезнет целая прослойка инженеров — синих воротничков, которые сегодня решают огромный объем довольно тривиальных с точки зрения математики задач.
— Но нетривиальные задачи все-таки будут решать люди?
— Безусловно. Сложными машинами и механизмами будут заниматься люди, но проблема в том, что среди 70 млн инженеров-конструкторов в мире сложными методами владеет всего 1 процент! Это известная вещь, 99 процентов как раз большую часть своего времени отыскивают аналоги.
— Даже страшно себе представить, чем будут заниматься эти миллионы инженеров, когда они окажутся на улице благодаря прогрессу!
— Это отдельный разговор, просто сама работа инженера стремительно меняется. Понимаете, раньше самолет делался 10-15 лет, а сегодня если он не будет обновляться каждые 4 года, то компания прогорит. Все это работает на совершенно другой идеологии, методологии, на совершенно новых подходах. Если раньше методы инженерии были основаны на профессионализме, чутье, здравом смысле разработчика, на знаниях и длительном опыте работы, то сейчас ты должен уметь правильно трактовать те результаты, которые тебе выдает компьютер. Ты можешь, конечно, как прежде, выучить сопромат, но это как логарифмическая линейка, которой пользоваться сегодня, в принципе, смешно. Старая инженерная школа во всем мире просто умерла.
— В России она умерла как-то по-особенному, в последние годы слышатся призывы возрождать класс инженеров, в то время как раньше они были как раз самым избыточным классом. Каких инженеров, на ваш взгляд, нам не хватает в первую очередь?
— Абсолютно любых инженеров без ограничения. Известно, что российская, еще дореволюционная, а потом и советская инженерная школа была очень сильной. Но она вся погибла в связи с тем, что за прошедшие 25 лет, когда, как я сказал, профессия инженера радикально менялась, мы ничего не делали и время упустили. Если сегодня посмотреть на все наши крупные предприятия, то везде есть такое двухмодовое распределение по возрасту: молодежь до 30 лет и старички, которые уже вряд ли могут чему-то учить. Их знания не капитализируемы, поэтому у нас колоссальная нехватка инженеров во всех областях.
— А как у нас обстоит дело с образованием математиков? Наша математическая школа была известна далеко за пределами России.
— Знаете, когда в середине 1950-х CCCP запустил первый спутник, для США советское образование стало эталонным, они начали копировать то, что существовало у нас: систему математических кружков, спецшкол и т.д. У нас была прекрасно развита система всесоюзных олимпиад, которая охватывала миллионы детей. Даже если ты жил в самой глухой деревушке, тебя вылавливали широким неводом, и в конце концов ты оказывался в Москве. Сегодня какие-то частицы этой традиции сохранились, их нужно беречь, поддерживать.
Сейчас в России в целом сохранился довольно высокий уровень математической культуры. Есть прекрасная лаборатория в Санкт-Петербургском государственном университете, есть Математический институт им. Стеклова, Институт проблем передачи информации РАН (ИППИ), есть, в конце концов, совершенно уникальный для всего мира Независимый университет, который был сделан подвижниками математики без копейки государственных денег.
— За счет чего математическая школа смогла пережить 25 лет развала, поглотившего инженерную школу?
— Традиция — великое дело, она представляет собой распространение вниз во времени стереотипов работы, поведения, организации институтов. У нас сохранились довольно жесткие математические семинары, которыми в свое время славились стены ИППИ РАН, где работал тот же Израиль Моисеевич Гельфанд. Там, например, назвать человека дураком публично было нормально, естественно. Если ты говорил ерунду, то тебя могли оборвать на любом слове и пояснить, кем ты являешься на самом деле. Это была очень жесткая аудитория, где нужно было выпить полпузырька валерьянки, прежде чем зайти. С одной стороны, она, безусловно, людей ломала, делала сумасшедшими в прямом смысле этого слова, но с другой — в ней была великая польза, потому что она не позволяла расслабиться, давала невероятную интеллектуальную закалку. Если о человеке говорили, что он, например, прошел семинар Добрушинской математической лаборатории или семинар академика Ландау, то это сразу характеризовало его определенным образом. Сегодня этого почти не осталось, а на Западе, кстати, исчезло совсем. Это очень забавная история, но там ученые перестали задавать друг другу вопросы. Все настолько атомизировались, занимаются очень узкими направлениями и совершенно не интересуются тем, что происходит рядом. Поэтому если вы слышите после выступления вопросы — это скорее всего русские.
— Вы однажды сказали, что в России работает тысяча математиков. Это много или мало?
— Знаете, эта цифра, конечно, очень лукавая, потому что ключевое слово здесь "работает". Например, есть великий человек, математик Яков Григорьевич Синай, лауреат премии Абеля. Ему 81 год, он живет в Штатах, но каждое лето появляется в Москве в ИППИ и начинает с отчета о проделанной работе за год — какие новые открытия сделал, что доказал... Но это редчайшее исключение.
— А какой идеальный возраст для занятия математикой?
— Пик математических достижений приходится на возраст до 40-50 лет. Правда, не поймешь, где берет свое природа, а где убеждения. Например, сам Колмогоров сказал, что будет заниматься математикой до 60 лет. И в 60 лет бросил, стал учебники писать, вести семинары и т.д. Это было сознательное решение. Поэтому выражение "работающий математик" коварное, потому что невозможно о человеке с огромными математическими заслугами сказать, что он не математик. С другой стороны, он перестал порождать новое знание.
— Но в целом для такой страны, как Россия, этого достаточно или нужно звонить во все колокола и каким-то образом воспитывать математиков?
— Вы знаете, буквально в последнее время произошла одна очень странная вещь. Всегда считалось, что XXI век — век наук о биологии. И вот буквально недавно в двух американских журналах одновременно появились данные независимых опросов, в которых наиболее перспективной профессией называется математика. И при некотором размышлении можно понять, почему. Потому что появился тот огромный объем данных, о котором мы говорили в начале беседы, и его нужно анализировать. Это стало стержнем практически для всех наук. Социология, биология, физика, даже история работают с большим объемом данных. А методы извлечения знаний из данных — это как раз то направление, которое активно развивает математика. Она ищет закономерности, пытается понять и предсказывать что будет, предположим, если вы измените форму крыла самолета или введете новый корм в рацион племенной породы кур. Так что в каком-то смысле именно математика становится ключевой наукой.
— Приведите, пожалуйста, пример, в этой области.
— Я очень люблю примеры с сельским хозяйством. У нашей стартап-компании второй по значимости покупатель софта — это крупнейшая в мире компания, которая занимается животноводством и растениеводством. Они покупают программы, которые могут просчитать, каким образом лучше скрещивать те или иные породы свиней или каким именно образом нужно проводить селекцию новых сортов растений. Говоря иными словами, мы задаем параметры того, что хотим получить на выходе, а программа выдает рецепт, что необходимо сделать.
Еще у нас есть такие забавные, казалось бы, для математики покупатели, как "Луи Виттон". У них новая фишка — они делают крем для депигментации кожи. Масса китаянок пользуется такими продуктами для отбеливания кожи. Так вот о рецепте для такого крема. Мы выдали идеальную формулу в процентном соотношении нескольких десятков ингредиентов. В основе всего этого лежит очень качественная, очень тонкая математика.
Поэтому, конечно, математику нужно развивать в любом виде, она очень многообразна. На рубеже 1990-х годов, когда закончилась холодная война, в Америке появилась пословица: "Нет звездных войн — нет математики". А потом оказалось, что это совсем не так. Сегодня математика в гораздо большей степени нужна для нашей обычной жизни.
— Но при этом вы именно в оборонке проработали почти два десятка лет и, как я знаю, считаете это лучшим временем своей жизни.
— Я работал в НИИ автоматической аппаратуры. Это была система управления стратегическими ядерными сетями, начиная с того самого знаменитого чемоданчика, который, по сути, лишь деталь огромной системы. В нашей кооперации тогда работало почти 200 институтов и заводов. А сейчас таких ресурсов просто физически нет. Советская оборонка — совершенно уникальная система. Мы не понимали той мощи, интеллектуальной и производственной, которой обладали в то время. Другое дело, что при этом же существовала такая избыточность и неэффективность, что это, на мой взгляд, в итоге и погубило нашу страну.
— Сегодня, как ни странно, даже в США, где на армию тратятся большие деньги, оборонка не приносит значимых открытий, как было полвека назад. С чем это связано?
— Прежде всего с тем, что основной технологический тренд сегодня завязан на электронику, а развитие электроники — на массовый спрос, на нас с вами. Если взять суммарный заработок современных крупных компаний с массовых продаж, то бюджет любой страны, даже США, просто отдыхает. Поэтому сегодня именно у этих компаний намного больше возможностей, чтобы создавать прорывные технологии, и именно оттуда они уже идут в оборонку. Так что тут все завязано исключительно на экономику.
— Вы в феврале вступили в должность ректора Сколтеха. У него чрезвычайно разные специализации — от информационных технологий и энергетики до космоса и биомедицины. Где, на ваш взгляд, можно ожидать какого-то качественного прорыва?
— Агро- и нейродисциплины. Причем агро- я поставлю на первое место. Для примера возьмем производство курятины: представьте себе, что сегодня Россия закупает практически 99 процентов генетического материала в этой отрасли. Мы покупаем яйца, из которых вылупляются цыплята, семена, корма и так далее у трех мировых монополистов. Наша первоочередная задача сделать так, чтобы самим разработать такие технологии, которые позволят нам всерьез говорить о продовольственной безопасности. Знаете, я часто говорю о том, что если бы мне сейчас было 18 лет, то я бы пошел в биологию. На стыке биологии и математики в ближайшее время будет происходить все самое интересное.
|