Открытие российских ученых: Искусственный интеллект для поиска стабильных молекул

Новости науки

Новый метод на основе ИИ позволил находить «потерянные» фрагменты молекул

Российские ученые совершили прорыв, разработав уникальный метод, который позволяет выявлять стабильные геометрические формы молекулярных соединений, часто упускаемые традиционными подходами к молекулярному моделированию. В ходе испытаний на шестидесяти потенциально биологически активных соединениях новый алгоритм смог обнаружить до 28 ранее неизвестных конформаций (геометрий) почти для половины исследованных молекул.

Этот инновационный подход, объединяющий принципы квантовой химии и машинного обучения, анализирует существующие геометрические варианты молекул, полученные с помощью других методов конформационного поиска, и эффективно находит недостающие всего за 20–30 итераций. Разработанный инструмент обладает огромным потенциалом для ускорения поиска и создания новых фармацевтических препаратов, а также для разработки высокоэффективных катализаторов. Результаты этого важного исследования были опубликованы в престижном издании Journal of Chemical Information and Modeling.

Молекулярное моделирование
Изображение демонстрирует концепцию молекулярного моделирования.

Молекулы способны существовать в различных пространственных конфигурациях, известных как геометрии или конформации, что обусловлено вращением их отдельных частей. Каждая такая конформация обладает уникальным набором химических и физических свойств. Поэтому для точного предсказания характеристик соединения с использованием квантово-химического моделирования крайне важно учитывать все его возможные геометрические формы. При этом пропуск даже одной значимой конформации может исказить результаты моделирования, сделав их неточными или даже вредными для практического применения. Однако, несмотря на прогресс, даже наиболее продвинутые современные методы часто не способны обнаружить все наиболее устойчивые конформации молекул.

Ученые из Института органической химии имени Н. Д. Зелинского РАН (Москва) и Московского государственного университета имени М. В. Ломоносова (Москва) разработали инновационный метод, основанный на искусственном интеллекте, специально предназначенный для выявления упущенных геометрических форм в уже существующих наборах конформаций молекул.

В основе нового алгоритма лежит метод машинного обучения, известный как гауссовские процессы. На начальном этапе модель обучается на данных об энергии вращения молекулярных фрагментов, полученных с помощью точных квантово-химических расчетов. В отличие от стандартных подходов, эта программа не только ищет наиболее энергетически выгодную конформацию (глобальный минимум), но и активно исследует ранее недоизученные области конформационного пространства. Такой подход позволяет модели идентифицировать потенциально выгодные структурные особенности, даже если они не были выявлены в ходе предыдущих конформационных поисков. Дополнительное преимущество метода заключается в его эффективности: для нахождения пропущенных конформаций требуется всего 20–30 итераций, что делает его применимым даже для крупных молекул со сложной структурой и множеством заместителей.

«Обычно в науке применяются классические методы машинного обучения, разработанные для использования в ситуациях, когда данных для обучения много. Часто же задачи, возникающие в химии, не могут удовлетворить этим условиям, поскольку получение данных в них сопряжено с затратными экспериментами. В связи с этим кажется перспективным применение байесовских методов — подходов, при которых модель самостоятельно оценивает свою уверенность в предсказаниях. Это преимущество позволяет успешно применять такие методы даже в ситуациях, когда данных очень мало — всего десятки измерений. Именно при помощи байесовских методов, к которым относятся гауссовы процессы, нам и удалось достигнуть полученного результата».
Иван Беспалов, студент химического факультета МГУ им. М. В. Ломоносова, сотрудник группы теоретической химии ИОХ РАН

Фото части группы теоретической химии перед входом в ИОХ РАН
Фото части группы теоретической химии перед входом в ИОХ РАН.

Исследователи провели тестирование алгоритма на 60 биологически значимых молекулах, включая пептиды и известные лекарственные соединения. Для этого были использованы данные о конформациях, полученные с помощью одного из самых надежных современных методов конформационного поиска — CREST. Выяснилось, что новый подход успешно обнаружил конформации, пропущенные CREST, для 24 из 60 исследованных молекул. В некоторых случаях алгоритм выявил до 28 новых конформаций. Особенно показательными оказались результаты при анализе соединений, содержащих амидные фрагменты (ключевые азотсодержащие группы, присутствующие во всех белках и пептидах): в этих случаях алгоритм всегда находил энергетически выгодные формы, которые CREST не смог обнаружить.

«Разработанный нами метод позволяет существенно повысить надежность молекулярного моделирования и увеличить скорость поиска новых стабильных органических и металлоорганических веществ с заданными свойствами, которые потенциально могут стать, например, лекарственными препаратами или новыми катализаторами. Он станет важным шагом к автоматическому молекулярному моделированию, которое позволит надежно получать достоверные результаты с минимальным участием человека. Сейчас мы продолжаем работу над другими цифровыми инструментами, комбинирующими физику и искусственный интеллект, которые должны закрыть другие проблемы, отделяющие нас от этой цели».
Михаил Медведев, кандидат физико-математических наук, старший научный сотрудник группы теоретической химии ИОХ РАН

Фото делегации группы теоретической химии на Конференции имени В.А. Фока
Фото делегации группы теоретической химии на Конференции имени В.А. Фока в августе 2022 года, где участвовали четверо из пяти авторов работы. Слева направо: Игорь Баширов, Юлия Вельмискина, Иван Беспалов, Василий Чалый, Николай Кривощапов, Михаил Медведев, Артем Куницын, Тимофей Лосев.
Виктор Лебедев
Виктор Лебедев

Виктор Лебедев - политический обозреватель из Ярославля с 8-летним стажем. Специализируется на анализе международных отношений и региональной политики центрального федерального округа.

Обзор последних событий в мире шоу-бизнеса