Научно-образовательные школы Московского университета

Создан алгоритм для прогнозирования взаимосвязи состав-структура-свойства

Мозг
В рамках работы НОШ МГУ «Мозг» сотрудники Московского университета на примере соединений класса гибридных галогеноплюмбатов показали, что использование универсального топологического представления кристаллических структур позволяет с помощью машинного обучения предсказывать с высокой точностью взаимосвязи состав-структура-свойства.

Слоистые гибридные галогеноплюмбаты с перовскитоподобной структурой – один из самых активно исследуемых на сегодняшний день классов полупроводниковых материалов. Эти соединения являются перспективными для применения в фотовольтаике и оптоэлектронике. Данные материалы обладают большим разнообразием химического состава и кристаллических структур, и на сегодняшний день насчитывается порядка тысячи экспериментально полученных фаз данного класса.

В последние годы машинное обучение стало мощным инструментом для ускорения открытия материалов путем прогнозирования их физических свойств. Однако, использование методов машинного обучения для прогнозирование физических свойств гибридных галогеноплюмбатов и поиск новых, ещё не синтезированных соединений этого класса является сегодня нерешенной задачей. Сложность моделирования связана с неоднозначностью представления кристаллических структур в машиночитаемом виде.

Топологические методы представления кристаллических структур, которые фиксируют пространственное расположение и связность атомов в материале, показали перспективность в повышении предсказательной точности моделей машинного обучения. В этом контексте разработка эффективных топологических дескрипторов для гибридных галогенидных соединений может значительно улучшить способность прогнозировать их оптоэлектронные свойства. Проведенное исследование иллюстрирует подход к прогнозированию значений ширины запрещенной зоны с использованием алгоритмов машинного обучения, улучшенных инвариантными топологическими представлениями кристаллических структур материалов посредством метода атомно-специфической персистентной гомологии. Информация о кристаллической структуре в этом методе кодируется в виде универсального бар-кода или «отпечатка пальца», на котором отражены все характеристики взаимодействия между всеми атомами кристаллической структуры. Такой подход к описанию кристаллических структур является универсальным и инвариантным, поскольку дескрипторы кристаллических структур не представлены в виде гетерогенных параметров, таких как параметры элементарной ячейки, углы и координаты атомов. Все геометрические параметры представлены однородно в виде значений межатомных расстояний в локальном окружении каждого атома.

Таким образом, в результате преобразования классического файла кристаллографической информации (CIF) кристаллической структуры в бар-код получается набор данных, который легко представить в машиночитаемой форме в виде многомерного вектора. Используя данное топологическое представление, была создана регрессионная модель машинного обучения на основе деревьев решений для прогнозирования ширины запрещенной зоны слоистых гибридных перовскитоподобных соединений.

Средняя абсолютная ошибка созданного алгоритма машинного обучения для предсказания ширины запрещенной зоны для исследуемого класса соединений с использованием векторов топологических признаков составила 0.12 эВ. Таким образом, представление кристаллических структур слоистых гибридных галогеноплюмбатов в виде бар-кодов является хорошим универсальным машиночитаемым представлением для целевого проектирования материалов этого класса.