Группа ученых из Казанского федерального университета, МГУ, Университета Страсбурга (Франция) и университета Хоккайдо (Япония) объединила методы машинного обучения и химические уравнения.

Это нужно для более точного предсказания характеристик молекул, что используется при компьютерном дизайне новых лекарств или материалов. Результаты работы опубликованы в Journal of Chemical Information and Modeling. Исследование является первым результатом проекта в рамках Президентской программы исследовательских проектов Российского научного фонда.

Методы машинного обучения и искусственного интеллекта все шире применяются в дизайне лекарств и материалов, медицинской и технической диагностике. Эти методы способны извлекать закономерности на основе множества данных, а потому могут находить сложные и неочевидные взаимосвязи между переменными. С другой стороны, полученные зависимости, построенные на ограниченной выборке, не всегда выявляют фундаментальные законы природы. В результате страдают точность вычислений и качество предсказания на новых данных. В то же время в химии часто известны физические или эмпирические законы, связывающие те или иные характеристики молекул или реакций.

Интернациональный коллектив ученых из Казани, Москвы, Страсбурга и Хоккайдо предложил способ, который позволяет методам машинного обучения использовать фундаментальные химические законы при предсказании свойств молекул. Исследователи рассмотрели проблему прогнозирования характеристик таутомерного равновесия, то есть способности молекул превращаться из одной формы (таутомера) в другую за счет перехода протона с одного атома на другой. Таутомерия — явление обратимой изомерии, когда несколько веществ имеют одинаковый качественный и количественный состав, но отличаются расположением некоторых групп и связей. Она является одним из важнейших явлений в органической химии. Кроме того, таутомерия — ключевой фактор, влияющий на появление мутаций, а также функционирование нуклеиновых кислот, белков и сахаров. По этой причине важно учитывать таутомерные превращения при регистрации новых соединений, компьютерном дизайне новых лекарств и поиске молекул с заданными свойствами.

Известно, что характеристики (например, константа таутомерного равновесия) процесса перехода одной таутомерной формы в другую связаны с кислотностью молекул. Соответствующее уравнение, открытое советским химиком М. И. Кабачником, используется почти во всех хемоинформатических инструментах предсказания константы таутомерного равновесия. Ранее авторы статьи показали, что качество таких расчетов достаточно низкое. Проблема применения уравнения заключается в том, что некоторых таутомеров в равновесии очень мало, и определить их кислотность невозможно. Вероятность ошибки при ее предсказании высока, и получаются неверные результаты.

«Мы пришли к выводу, что нужно создать модель, которая умела бы принимать во внимание уравнение Кабачника и обучалась одновременно на данных по таутомерии и кислотности», — рассказывает руководитель проекта Тимур Маджидов, кандидат химических наук, старший научный сотрудник Казанского федерального университета.

В работе были рассмотрены два варианта действий. В первом случае использовали множественную линейную регрессию, то есть считали, что зависимость кислотности от структуры можно описать линейным законом. Во втором случае для предсказания кислотности использовали нелинейные уравнения, которые в качестве решения предлагали нейронные сети. Обе модели учатся прогнозировать таутомерию с использованием уравнения Кабачника. Оказалось, что если обучать модель только на данных по кислотности, то качество предсказания константы таутомерного равновесия хуже, чем при ее предсказании случайным образом. Результаты изменились, когда ученые объединили подходы. Точность получившейся сопряженной модели совпадает с таковой у лучших моделей, способных, однако, предсказывать только одно свойство. Более того, она работает в случае кислотности таутомерных форм, которых в растворе содержится очень мало, и делает это почти так же хорошо, как и для «обычных» молекул.

Итог исследования — создание вычислительной модели, которая обеспечила более точное нахождение константы кислотности и таутомерии. Авторами была предложена концепция сопряженных моделей QSPR (количественной взаимосвязи структуры и свойств) для одновременного предсказания нескольких функционально связанных характеристик. Подобные модели в будущем позволят осуществлять более точный прогноз физико-химических свойств соединений и параметров химических реакций, а также помогут в поиске новых лекарственных препаратов.

Похожие новости

  • 08/10/2017

    Секреты картин и криминал: как ученые из России помогают британской полиции

    ​Сергей Казарян, профессор физической химии из Имперского колледжа Лондона, рассказал, как современные методы химии и физики позволяют вычислять преступников по химическим следам отпечатков пальцев, раскрывать фальшивки и изучать историю давно минувших дней.
    1108
  • 08/11/2019

    Получен рекордный ториевый сверхпроводник

    Междисциплинарная группа российских ученых под руководством Ивана Трояна из Института кристаллографии РАН и Артема Оганова из Сколтеха и МФТИ смогли создать новый гидрид тория, одна молекула которого содержит 10 атомов водорода.
    623
  • 24/12/2019

    Выбор РИА Новости: главные достижения российской науки 2019 года

    ​Ученые в России в нынешнем году получили знаковые результаты в самых разных областях – от астрономии до археологии, причем многие достижения имеют выходы на практическое применение. Примечательно, что существенную лепту здесь внесли не только признанные научные центры, но и ведущие отечественные вузы.
    363
  • 11/10/2019

    Электрохимия на службе у фотоники: как углеродные нанотрубоки управляют лазерными импульсами

     Международная команда ученых, которую возглавила группа из Лаборатории наноматериалов Центра фотоники и квантовых материалов Сколковского института науки и технологий, показала возможность управления нелинейно-оптическим откликом углеродных нанотрубок с помощью электрохимического легирования.
    282
  • 09/04/2019

    Сибирские ученые оптимизируют работу электронных дисплеев органическими полупроводниками

    ​Ученые Новосибирского государственного университета (НГУ) займутся исследованием свойств органических полупроводников (материалов, используемых в электронике), чтобы повысить эффективность используемых сейчас электронных дисплеев, сообщил ТАСС руководитель лаборатории органической оптоэлектроники НГУ Евгений Мостович.
    1062
  • 23/09/2019

    В России создали диагностическое оборудование для ITER

    ​Российские ученые разработали диагностическое оборудование для Международного экспериментального ядерного реактора ITER, которое может работать в экстремальных условиях. Это ускорит процесс строительства нового, более экологичного и безопасного источника энергии.
    468
  • 25/09/2018

    Физики измерили намагниченность диэлектрика за одну триллионную долю секунды

    Коллектив ученых из России, Германии, Швеции и Японии разработал способ изменить намагниченность диэлектрика, воздействуя на него сверхкороткими лазерными импульсами. Ученым удалось добиться времени изменения намагниченности в одну пикосекунду – это в 100 раз меньше, чем предполагалось ранее.
    766
  • 10/07/2019

    В России пройдут испытания новой модели сверхзвукового самолёта

    В России в 2019 году пройдут испытания модели сверхзвукового делового самолета разработки "Туполева" со сниженным уровнем звукового удара. Его испытают в аэродинамической трубе, сообщил "Интерфаксу" источник в авиапроме.
    946
  • 08/10/2019

    12 октября Президент РАН выступит на IX Всероссийском Фестивале NAUKA 0+ с лекцией «Периодическая таблица элементов: универсальный язык науки от космоса до новых материалов»

    12 октября в Москве Президент Российской академии наук Александр Сергеев выступит на IX Всероссийском Фестивале NAUKA 0+ с лекцией «Периодическая таблица элементов: универсальный язык науки от космоса до новых материалов», которая состоится с 11.
    1204
  • 12/06/2019

    Глава ОИЯИ рассказал о значении участия России в ЦЕРН

    Полноправное участие России в Европейской организации по ядерным исследованиям (ЦЕРН) необходимо для участия отечественных ученых в проектах в области физики высоких энергий и приведет к укреплению позиций российской науки в мире, считает директор Объединенного института ядерных исследований (ОИЯИ) академик Виктор Матвеев.
    598