Нейросеть Google придумала 2,2 млн новых кристаллов — тысячи из них можно воплотить в лаборатории

0
1

Исследователи Google DeepMind объявили, что им с помощью искусственного интеллекта удалось открыть 2,2 млн ранее неизвестных кристаллических материалов, из которых 380 тыс. признаны стабильными. Многие из них могут быть полезны в разных технологических областях: от батарей до сверхпроводников. Учёные с помощью роботизированной лаборатории смогли воспроизвести части этих материалов. Прежде на это ушли бы годы, а сейчас — полмесяца.

adbb842bb9c1406f1fd3775f914014e6

Источник изображения: Google

Лаборатория A-Lab с помощью роботов оперирует самыми разными ингредиентами, такими как оксид никеля и карбонат лития, предназначена для получения новых и интересных экспериментальных материалов, некоторые из которых могут найти применения в будущих аккумуляторах. Результаты могут быть непредсказуемыми. Даже ученый-человек обычно не создаёт то, что нужно с первого раза. Поэтому иногда роботы производят просто красивый порошок. В других случаях это расплавленное клейкое месиво, или всё испаряется, и ничего не остаётся.

«В этот момент человеку придется принимать решение: Что мне теперь делать?», — говорит Гербранд Седер (Gerbrand Ceder), материаловед из Лаборатории Лоренса Беркли (LBL, Laboratory of Lawrence Berkeley) в Калифорнийском университете Беркли. Роботы должны то же самое. Они анализируют то, что получилось, корректируют рецепт и пробуют снова. И ещё раз. И снова. «Утром вы даёте им несколько рецептов, а когда возвращаетесь домой, у вас может получиться новое прекрасное суфле, — отмечает материаловед Кристин Перссон (Kristin Persson), сотрудница Седера в LBL. — А может быть, вы вернётесь в сгоревший беспорядок! Но, по крайней мере, завтра они сделают суфле намного лучше».

Недавно ассортимент «блюд», доступных роботам в LBL, вырос в геометрической прогрессии благодаря программе искусственного интеллекта, разработанной Google DeepMind. Алгоритм, получивший название GNoME, был обучен на основе данных из проекта «Материалы» — бесплатной базы данных, содержащей 150 000 известных материалов, которую курирует Перссон. Используя эту информацию, система искусственного интеллекта предложила проекты материалов, содержащие 2,2 миллиона новых кристаллов, из которых 380 000 были признаны стабильными. Они не разлагаются и не взрываются, а значит, наиболее подходят для синтеза в лаборатории, что расширило диапазон известных стабильных материалов почти в 10 раз. В статье, опубликованной сегодня в Nature, авторы пишут, что в этой расширенной базе данных может скрываться следующий инновационный твердотельный электролит, или материал для солнечных батарей, или высокотемпературный сверхпроводник.

Поиск иголок в стоге сена начинается с их изготовления, что является ещё одной причиной для быстрой и непрерывной работы. В ходе недавних экспериментов автономная лаборатория Седера в LBL смогла создать 41 теоретический материал с помощью GNoME за 17 дней, что помогло подтвердить дееспособность как модели ИИ, так и роботизированных методов лаборатории.

При принятии решения о том, можно ли на самом деле изготовить материал, будь то человеческими руками или руками робота, одним из первых вопросов является вопрос о его стабильности. Как правило, это означает, что совокупность атомов находится в минимально возможном энергетическом состоянии. В противном случае кристалл захочет превратиться во что-то другое. На протяжении тысячелетий люди постоянно пополняли список стабильных материалов, первоначально наблюдая за теми, что встречаются в природе, или открывая их благодаря элементарной химической интуиции или случайности. В последнее время материалы стали разрабатывать с помощью компьютеров.

Проблема, по мнению Перссон, заключается в предвзятости: со временем коллективные знания стали отдавать предпочтение определенным знакомым структурам и элементам. Материаловеды называют это «эффектом Эдисона»: знаменитый изобретатель активно использовал метод проб и ошибок при создании нити накаливания. В ходе подбора материала для неё были испытаны тысячи видов углерода, прежде чем учёный пришел к разновидности, полученной из бамбука. Венгерской группе потребовалось ещё десять лет, чтобы придумать использовать вольфрам. «Он был ограничен своими знаниями, — утверждает Перссон. — Он был предвзят, он был предубеждён».

Подход DeepMind призван преодолеть эти предубеждения. Команда начала с 69 000 материалов из базы данных, которая является бесплатной и финансируется Министерством энергетики США. Это было хорошее начало, поскольку база данных содержит подробную энергетическую информацию, необходимую для понимания того, почему одни материалы стабильны, а другие — нет. Но этих данных недостаточно, чтобы преодолеть то, что исследователь Google DeepMind Экин Догус Кубук (Ekin Dogus Cubuk) называет «философским противоречием» между машинным обучением и эмпирической наукой.

Как и Эдисон, ИИ борется за то, чтобы генерировать действительно новые идеи, выходящие за рамки того, что он видел раньше. «В физике вы никогда не займётесь изучением того, что уже знаете, — говорит он. — Вы почти всегда хотите обобщить то, что вам уже известно, — будь то открытие другого класса материалов для батарей или новой теории сверхпроводимости».

GNoME использует подход, называемый активным обучением. Сначала графовая нейронная сеть (GNN) использует базу данных материалов для изучения закономерностей в стабильных структурах и выяснения того, как минимизировать энергию атомных связей в новых структурах. Используя весь диапазон периодической таблицы Менделеева, она выдает тысячи потенциально стабильных кандидатов в материалы. Следующий шаг — их проверка и корректировка с помощью метода квантовой механики, называемого теорией функционала плотности, или DFT. На следующем этапе эти уточнённые результаты снова подключаются к обучающим датасетам, и процесс повторяется.

6532698ef357137efea177b7bb8efde0

Источник изображения: Jenny Nuss/Berkeley Lab

Исследователи обнаружили, что при многократном повторении этот подход позволяет генерировать более сложные структуры, чем те, которые изначально были в датасете Materials Project, включая некоторые, состоящие из пяти или шести уникальных элементов. (Датасет, использовавшийся для обучения ИИ, в основном ограничивался четырьмя). Эти типы материалов включают так много сложных атомных взаимодействий, что они обычно не поддаются человеческой интуиции.

Но DFT — это только теоретическое обоснование. Следующий шаг — это реальное создание чего-либо. Поэтому команда Седера выбрала 58 теоретически возможных кристаллов для создания в лаборатории A-Lab. Учитывая возможности лаборатории и доступные компоненты, выбор был случайным. И поначалу, как и ожидалось, роботы терпели неудачи, а затем система неоднократно корректировала рецепты. После 17 дней экспериментов A-Lab удалось получить 41 стабильный материал, или 71 % от изначально выбранного перечня, причём иногда после опробования десятка различных рецептов.

Тейлор Спаркс (Taylor Sparks), материаловед из Университета Юты, не принимавший участия в исследовании, говорит, что видеть, как автоматика работает над синтезом новых типов материалов, многообещающе. Но использование искусственного интеллекта для предложения тысяч новых гипотетических материалов, а затем погоня за ними с помощью автоматики, просто нецелесообразна, добавляет он. GNN широко используются для разработки новых идей для материалов, но обычно исследователи хотят направить свои усилия на создание материалов с полезными свойствами, а не на слепое воспроизведение сотен тысяч таких материалов. «У нас уже есть слишком много вещей, которые мы хотели бы исследовать, но физически не смогли, — говорит он. — Я думаю, проблема в том, приближается ли этот масштабный синтез к количеству предсказанных материалов? Даже близко нет».

Лишь часть из 380 000 материалов, описанных в статье Nature, может быть создана на практике. Некоторые из них включают радиоактивные элементы, слишком дорогие или редкие. Некоторые потребуют синтеза в экстремальных условиях, которые невозможно создать в лаборатории, а каким-то нужны составляющие, которые учёным просто неоткуда взять. Это, скорее всего, относится даже к материалам, которые могут стать потенциально полезными при создании фотоэлектрического элемента или батареи следующего поколения. «Мы придумали много классных материалов, – утверждает Перссон. – Их изготовление и тестирование неизменно оказываются узким местом, особенно если речь идет о материале, который ещё никто не делал. Число людей, которым я могу позвонить из своего круга друзей и сказать: «Конечно, давайте я займусь этим для вас», – всего лишь один или два человека». «Действительно, неужели так много?» – с улыбкой спрашивает Седер.

Даже если материал может быть создан, предстоит долгий путь превращения базового кристалла в продукт. Перссон приводит в пример электролит внутри литийионного аккумулятора. Предсказания об энергии и структуре кристалла могут быть применены для решения таких задач, как определение того, насколько легко ионы лития могут перемещаться по нему – это ключевой аспект производительности. Но что не так легко предсказать, так это то, вступит ли этот электролит в реакцию с соседними материалами и не разрушит ли он всё устройство? К тому же, как правило, полезность новых материалов становится очевидной только в сочетании с другими материалами или при манипулировании ими с помощью химических добавок.

Тем не менее, расширение спектра материалов увеличивает возможности синтеза, а также предоставляет больше данных для будущих программ искусственного интеллекта, говорит Анатоль фон Лилиенфельд (Anatole von Lilienfeld), материаловед из Университета Торонто, который также не принимал участия в исследовании. Кроме того, это помогает материаловедам отвлечься от своих предубеждений и устремиться к неизведанному. «Каждый новый шаг, который вы делаете, – это фантастика, – восхищается он. – Этот шаг может открыть новый класс соединений».

Google также заинтересована в изучении возможностей новых материалов, созданных GNoME, говорит Пушмит Кохли (Pushmeet Kohli), вице-президент по исследованиям в Google DeepMind. Он сравнивает GNoME с AlphaFold, программным обеспечением компании, которое поразило структурных биологов своим успехом в предсказании того, как складываются белки. Обе программы решают фундаментальные проблемы, создавая архив новых данных, которые ученые могут изучать и расширять. Далее компания планирует заняться более конкретными проблемами, такими как поиск интересных свойств материалов и использование искусственного интеллекта для ускорения синтеза.

Обе эти задачи являются сложными, поскольку для начала обычно имеется гораздо меньше данных, чем для прогнозирования стабильности. Кохли говорит, что компания изучает возможности более непосредственной работы с физическими материалами, будь то привлечение сторонних лабораторий или продолжение академического партнерства. Он также добавил, что компания может создать собственную лабораторию, ссылаясь на Isomorphic Labs, подразделение DeepMind, занимающееся разработкой лекарств и основанное в 2021 году после успеха AlphaFold.

Всё может стать сложнее для исследователей, пытающихся применить материалы на практике. Проект «Материалы» популярен как среди академических лабораторий, так и среди корпораций, поскольку он допускает любой тип использования, включая коммерческие предприятия. Кандидаты в материалы, созданные Google DeepMind, выпускаются под отдельной лицензией, которая запрещает коммерческое использование. «Они выпускаются для академических целей, – поясняет Кохли. – Если люди захотят исследовать и изучить возможность коммерческого партнерства, мы будем рассматривать их заявки индивидуально в каждом конкретном случае».

Многие ученые, работающие с новыми материалами, отметили, что неясно, какое право голоса будет иметь компания, если тестирование в академической лаборатории приведет к возможному коммерческому использованию материала, созданного GNoME. Идея нового кристалла, не имеющая конкретного применения, как правило, не подлежит патентованию, и отследить её происхождение по базе данных может быть непросто.

Кохли также говорит, что, хотя данные и публикуются, в настоящее время нет планов выпускать модель GNoME. Он ссылается на соображения безопасности – по его словам, программное обеспечение теоретически может быть использовано для создания опасных материалов, – а также на неопределенность стратегии Google DeepMind в отношении материалов. «Трудно делать прогнозы относительно того, каким будет коммерческий эффект», – поясняет Кохли.

Спаркс ожидает, что его коллеги-ученые будут возмущаться отсутствием кода для GNoME в открытом доступе, как это делали биологи, когда AlphaFold была первоначально опубликована без полной модели. (Позже компания выпустила ее). «Это неприемлемо», – возмущается он. Другие материаловеды, вероятно, захотят воспроизвести полученные результаты и изучить способы улучшения модели или её адаптации к конкретным условиям использования. Но без модели они не смогут сделать ни того, ни другого.

Тем временем исследователи Google DeepMind надеются, что сотен тысяч новых материалов будет достаточно, чтобы теоретики и синтезаторы — как люди, так и роботы — не остались без дела. «Любая технология может быть улучшена с помощью лучших материалов. Это узкое место, – поясняет Кубук. – Вот почему мы должны развивать эту область, открывая новые материалы и помогая людям производить их ещё больше».

Источник: 3Dnews.ru