• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Ученые усомнились в том, что искусственный интеллект DeepMind понимает физику молекул с нецелым зарядом

Ученые усомнились в том, что искусственный интеллект DeepMind понимает физику молекул с нецелым зарядом

Фото: deepmind.com

В журнале Science, одном из самых авторитетных научных изданий, команда исследователей из Высшей школы экономики, Сколтеха, Института органической химии им. Н.Д. Зелинского и Kyungpook National University (Южная Корея) опубликовала комментарий к статье DeepMind, говорится на сайте Сколтеха. В нем ученые показали, что приведенные аргументы в пользу достижения поставленной DeepMind цели не настолько надежны, как кажется, и требуют дополнительного исследования.

Команда DeepMind в статье, опубликованной в журнале Science в декабре 2021 года, попыталась решить одну из ключевых проблем современной физики: создать метод теории функционала плотности (DFТ), корректно работающий для самых разных молекулярных систем, включая имеющие нецелое количество электронов.

Михаил Медведев

«Современные химия и наука о материалах постепенно переходят от экспериментального метода проб и ошибок к изучению цифровых двойников. Вместо того чтобы ставить десятки или даже сотни экспериментов в надежде найти новый эффективный катализатор или материал, для этого класса катализаторов/материалов создается цифровой двойник (математическая модель), который досконально изучается в компьютере, и на основании найденных теоретически закономерностей ставятся несколько прицельных экспериментов. Этот подход позволяет экономить килограммы дорогостоящих химических реагентов и тонны токсичных органических растворителей», — говорит руководитель Группы теоретической химии Института органической химии им. Н.Д. Зелинского РАН, доцент факультета химии НИУ ВШЭ Михаил Медведев.

Евгений Епифанов

Вместе с Михаилом Медведевым в группе исследователей над проблемой работал третьекурсник ОП «Химия» НИУ ВШЭ Евгений Епифанов. «Когда в начале 1-го курса мне пришлось определяться с лабораторией для научной работы, я хотел заниматься квантовой химией и решил выбрать группу теоретической химии ИОХ РАН, — рассказал он. — В этой группе есть разные направления работы, в целом можно описать их как предсказание возможности протекания реакций без проведения эксперимента. Я разрабатываю методы, чтобы такие расчеты были точнее. Здесь нужны не только знания химии, нужно еще уметь программировать. Но даже если не умеете, более опытные коллеги научат. Мне нравится этим заниматься, и я планирую писать диплом по этой теме».

Теория функционала плотности является самым широко используемым подходом для построения цифровых двойников в химии и науке о материалах. Она позволяет относительно корректно описать взаимодействие большого количества электронов между собой, что необходимо для построения цифровых двойников сложных химических систем: молекул, наночастиц, кристаллов. Основой теории функционала плотности является обменно-корреляционный функционал, для которого точный вид все еще не установлен, поэтому в настоящий момент для него используются различные приближенные выражения, которых уже более 400.

Петр Жиляев

«С каждым годом количество приближенных выражений для обменно-корреляционного функционала растет, предлагаются все более и более точные выражения. DeepMind, известные своей разработкой нейросетевой программы AlphaGo, победившей одного из сильнейших игроков мира в игру го, решили применить свои наработки в нейронных сетях для создания нейросетевого функционала теории функционала плотности. Их работа была далеко не первой, однако она однозначно является одной из самых амбициозных», — говорит старший научный сотрудник Центра технологий материалов Сколтеха Петр Жиляев.

DeepMind создали новый функционал теории функционала плотности — DM21. Предполагалось, что он будет способен корректно работать с системами, содержащими нецелое количество электронов: несмотря на отсутствие таких систем в природе, корректная работа функционала на них должна помочь ему в описании обычных химических систем. Для того чтобы научить свой функционал корректно работать на таких системах, команда DeepMind добавила их в базу данных, на которой обучался DM21. Чтобы убедиться, что DM21 научился работать на таких системах, авторы протестировали его на тестовом наборе BBB, состоящем из пар атомов на разных расстояниях друг от друга, например два атома водорода с одним электроном на двоих. DM21 показал превосходную точность на наборе BBB, обойдя стандартные функционалы, а также функционал DM21m, обученный DeepMind на том же датасете, за исключением систем с нецелым количеством электронов.

Авторы постарались обойти одно из ключевых ограничений традиционных функционалов — их неспособность корректно описывать системы с нецелым количеством электронов. DeepMind добавили в функционал новый нелокальный ингредиент (информацию о волновой функции системы, которую функционал может использовать для вычисления энергии), который ранее никогда не использовался, — пространственно разделенную локальную обменную энергию. В дальнейшем она может помочь строить функционалы с лучшим разделением между обменной и корреляционной энергиями.

Команда DeepMind ввела дополнительную регуляризацию, связанную с процедурой самосогласованного поля. Их дополнительное слагаемое в функции ошибки модели приближенно равно выражению для изменения энергии после шага вариационной процедуры минимизации, начинающегося с орбиталей традиционного функционала. Эта регуляризация позволяет сделать обучаемый функционал более стабильным.

«В машинном обучении очень важно не использовать для тестирования нейронной сети данные, на которых она была обучена. Однако в своей работе команда DeepMind допустила подобную ошибку: наиболее сложные димеры из набора BBB очень близки к системам с нецелым количеством электронов из обучающей выборки», — рассуждает инженер-исследователь Центра технологий материалов Сколтеха Александр Рябов.

«Если нейронные сети не могут понять, как прийти к правильным ответам, они пытаются их зазубрить. Поэтому не столь сложно обучить нейронную сеть — сложно показать, что она действительно осознала физические законы, лежащие в основе вопроса, на который она отвечает. Так что тестировать нейронную сеть на данных, на которых она обучалась, — это все равно что дать студенту на экзамене ту же задачу, которая разбиралась пять минут назад на доске: мы узнаем, хорошая ли у него память, но вряд ли узнаем, понимает ли он предмет», — отмечает Михаил Медведев.

Этот недостаток не был очевидным. Системы в наборе BBB состоят из двух атомов, тогда как DM21 обучался на одноатомных системах с нецелым количеством электронов. Поэтому предвидеть то, что произошло, было очень непросто. Ученые поняли, что при расстояниях между атомами в тест-сете BBB, где обычные функционалы начинают испытывать проблемы, атомы уже практически не взаимодействуют между собой и каждый атом в отдельности по сути становится тем самым «атомом с нецелым числом электронов», на которых проводилось обучение.

Читать материал в источнике

Вам также может быть интересно:

Динамику ESG в мире обсудили на международной конференции по вопросам устойчивого развития в Вышке

Участники форума «ESG Corporate Dynamics: the Challenges for Emerging Capital Markets» обсудили использование ИИ в сфере устойчивого развития, влияние климатической уязвимости на привлечение институциональных инвесторов, тренды ESG-политики в Южной Корее и Китае, разработку интегральной ESG-модели для оценки вероятности дефолта компаний и многие другие вопросы. В работе конференции, организованной факультетом экономических наук ВШЭ, приняли участие более 20 ученых из ведущих университетов Китая, Египта, Малайзии и других стран.

Исследователи из ВШЭ разработали Python-библиотеку для анализа данных движений глаз

Исследовательская группа из Высшей школы экономики разработала Python-библиотеку EyeFeatures, предназначенную для анализа и моделирования данных движений глаз. Инструмент призван облегчить работу ученых и разработчиков, предоставляя им возможность эффективно обрабатывать сложные данные и строить предсказательные модели.

Достижения Вышки в сфере ИИ представили на AIJ

На площадке международной конференции AI Journey состоялась сессия под руководством вице-премьера Дмитрия Чернышенко, посвященная достижениям российских исследовательских центров в области искусственного интеллекта. Руководитель Центра ИИ ВШЭ Алексей Масютин представил ключевые разработки исследователей центра.

Фантастика vs реальность: ВШЭ и Евразийский НОЦ обучили преподавателей Башкортостана работе с ИИ

В начале ноября в Уфе состоялось обучение по программе повышения квалификации «Искусственный интеллект и его применение в научных исследованиях» для преподавателей и ученых Республики Башкортостан. Организаторами программы выступили Центр непрерывного образования ФКН НИУ ВШЭ и Евразийский научно-образовательный центр. Обучение было реализовано в сетевой форме по трем направлениям: гуманитарному, естественно-научному и техническому.

Искусственная революция: как ИИ меняет образование

Искусственный интеллект стремительно ворвался в образовательное пространство и стал помощником и напарником студентов и преподавателей. Сегодня владение ИИ-инструментами становится универсальной компетенцией и требует от педагогов освоения новых навыков и подходов как к учебному процессу, так и к оцениванию успехов студентов.

Ученые НИУ ВШЭ признаны лидерами в сфере развития ИИ

В рамках международной конференции по искусственному интеллекту и машинному обучению AI Journey наградили победителей Национальной премии «Лидеры ИИ — 2024». Лауреатами стали Сергей Самсонов, научный сотрудник Международной лаборатории стохастических алгоритмов и анализа многомерных данных Института искусственного интеллекта и цифровых наук ФКН ВШЭ, и Елена Тутубалина из Института искусственного интеллекта AIRI и Научно-учебной лаборатории моделей и методов вычислительной прагматики ФКН ВШЭ. Еще один ученый Вышки стал финалистом премии.

Обуздать стихию: как ИИ интегрируется в учебный процесс в странах мира

Искусственный интеллект постепенно становится незаменимой частью высшего образования. Его используют и студенты, и преподаватели для снижения объема рутинных задач и расширения своих возможностей. Ограничения и перспективы ИИ рассматриваются в докладе «Начало конца или новой эпохи? Эффекты генеративного искусственного интеллекта (ГИИ) в высшем образовании», который вышел в журнале «Современная аналитика образования» под научной редакцией научного руководителя НИУ ВШЭ Ярослава Кузьминова.

Виртуальный Моцарт, бот «Венчурный капитал» и генерация учебных видео: как в Вышке применяют ИИ

В середине ноября в Вышке состоялся митап, на котором преподаватели, исследователи и административные работники университета представили собственные проекты и поделились опытом использования ИИ-технологий в образовательной и научной деятельности. Встреча прошла в рамках программы повышения квалификации «Искусственный интеллект в образовании и исследованиях».

Названы ключевые тренды в образовании — 2025

Искусственный интеллект и виртуальная реальность все чаще становятся частью образования. Больше половины преподавателей-новаторов готовы поддерживать мультимодальные подходы с использованием ИИ, а каждый третий студент считает, что технологии способны сделать учебу интереснее и удобнее. Такие данные представили Лаборатория инноваций в образовании ВШЭ и холдинг Ultimate Education.

Студенты Вышки выиграли международный этап «Цифрового прорыва»

В начале ноября в Калининграде прошел международный этап хакатона «Цифровой прорыв. Сезон: Искусственный интеллект». В нем приняли участие 203 команды в составе 1569 человек, и среди них — студенты факультета компьютерных наук ВШЭ, призеры всероссийского этапа. Они соревновались в решении задач от партнеров хакатона — РЖД, Media Wise, «Атома», «Росатома», «Силы» и других организаций.