Исследователи НОШ МГУ «Мозг» рассказали о результатах работы, посвященной использованию алгебро-геометрических методов в решении задач искусственного интеллекта (ИИ) и интеллектуального анализа данных. Ученые создали новый метод для обработки информации, который найдет применение в различных областях, связанных с большими данными.
Одной из фундаментальных задач в аналитике больших данных является упрощение структуры данных с максимальным сохранением нужной информации. В подходах к ее решению принято выделять методы сокращения размерности пространства данных и методы кластеризации, то есть представления заданного многообразия данных в виде малой совокупности специально вычисляемых подмножеств-кластеров, обладающих определенными свойствами.
Исследователи представили новый метод кластеризации данных в многомерном пространстве, основанный на понятиях локальной размерности и связности многообразия данных, а также плотности их распределения. Также удалось достигнуть результатов в сфере применения методов осреднения при получении скрытой информации из больших наборов данных с использованием топологических характеристик имеющихся многообразий данных. В упомянутом подходе ученые сделали акцент именно на геометрических свойствах многообразий данных, что свойственно естественному человеческому восприятию анализируемого объекта. Таким образом, предложенный метод является вкладом не только в теорию интеллектуального анализа данных, но и в развитие методов и средств искусственного интеллекта, применяемых в решении широкого круга прикладных задач.
«Можно выделить несколько ключевых направлений применения алгебро-геометрических методов и структур в аналитике данных и развитии приложений ИИ. Это, например, структурирование данных в задачах интеллектуального анализа больших данных и в методах машинного обучения, развитие новых методов моделирования сложных процессов в различных областях науки и практики, а также разработка моделей данных в решении задач искусственного интеллекта. Кроме того, алгебро-геометрические методы и структуры могут применяться при построении нетривиальных физических моделей, использующих некоммутативные и неассоциативные алгебраические структуры и в развитии методов сокращения размерности пространств данных в задачах интеллектуального анализа больших данных», — рассказал доцент кафедры теоретической информатики механико-математического факультета МГУ Сергей Главацкий.
Методы интеллектуального анализа больших данных широко используют алгоритмы умножения и обращения квадратных матриц большого размера. Ученые исследовали и оптимизировали алгоритмы быстрого умножения и обращения квадратных матриц, а также продолжили исследования новых алгебраических систем, таких как бигрупповые алгебры, предложили методы их применения в решении многих задач в различных областях математики и физики.
Кроме того, ученые исследовали неассоциативные алгебраические системы, их применение в построении нетривиальных структур данных, а также использование в развитии математических методов и алгоритмов в интеллектуальном анализе данных, задачах защиты информации, криптографических методов и др. Была разработана программа проверки примитивности элементов свободных неассоциативных алгебр и подсчета таких элементов над конечными полями с применением компьютерной алгебры Sage Math. Полученные результаты могут быть полезны не только в развитии методов и средств комбинаторной и компьютерной алгебры, но также в построении сложных моделей физических процессов и в алгебраической теории кодирования. Эти результаты являются вкладом в фундаментальные основы математических методов интеллектуального анализа данных и искусственного интеллекта.
Полученные результаты исследований имеют широкий спектр применения и могут активно использоваться как в фундаментальной науке, так и в различных практических областях, таких как психология, медицина, робототехника и другие области, работающие с большими данными.
Ученые уверены, что междисциплинарный синтез алгебро-геометрических подходов и методов топологической, линейной и компьютерной алгебр способствует разработке эффективных алгоритмов решения сложных задач в различных областях науки и практики на основе методов интеллектуального анализа данных и средств искусственного интеллекта.
Результаты исследования были представлены на Всероссийской конференции «Актуальные проблемы и перспективы развития естественных и точных наук», которая проводилась в рамках Десятилетия науки и технологий.
Одной из фундаментальных задач в аналитике больших данных является упрощение структуры данных с максимальным сохранением нужной информации. В подходах к ее решению принято выделять методы сокращения размерности пространства данных и методы кластеризации, то есть представления заданного многообразия данных в виде малой совокупности специально вычисляемых подмножеств-кластеров, обладающих определенными свойствами.
Исследователи представили новый метод кластеризации данных в многомерном пространстве, основанный на понятиях локальной размерности и связности многообразия данных, а также плотности их распределения. Также удалось достигнуть результатов в сфере применения методов осреднения при получении скрытой информации из больших наборов данных с использованием топологических характеристик имеющихся многообразий данных. В упомянутом подходе ученые сделали акцент именно на геометрических свойствах многообразий данных, что свойственно естественному человеческому восприятию анализируемого объекта. Таким образом, предложенный метод является вкладом не только в теорию интеллектуального анализа данных, но и в развитие методов и средств искусственного интеллекта, применяемых в решении широкого круга прикладных задач.
«Можно выделить несколько ключевых направлений применения алгебро-геометрических методов и структур в аналитике данных и развитии приложений ИИ. Это, например, структурирование данных в задачах интеллектуального анализа больших данных и в методах машинного обучения, развитие новых методов моделирования сложных процессов в различных областях науки и практики, а также разработка моделей данных в решении задач искусственного интеллекта. Кроме того, алгебро-геометрические методы и структуры могут применяться при построении нетривиальных физических моделей, использующих некоммутативные и неассоциативные алгебраические структуры и в развитии методов сокращения размерности пространств данных в задачах интеллектуального анализа больших данных», — рассказал доцент кафедры теоретической информатики механико-математического факультета МГУ Сергей Главацкий.
Методы интеллектуального анализа больших данных широко используют алгоритмы умножения и обращения квадратных матриц большого размера. Ученые исследовали и оптимизировали алгоритмы быстрого умножения и обращения квадратных матриц, а также продолжили исследования новых алгебраических систем, таких как бигрупповые алгебры, предложили методы их применения в решении многих задач в различных областях математики и физики.
Кроме того, ученые исследовали неассоциативные алгебраические системы, их применение в построении нетривиальных структур данных, а также использование в развитии математических методов и алгоритмов в интеллектуальном анализе данных, задачах защиты информации, криптографических методов и др. Была разработана программа проверки примитивности элементов свободных неассоциативных алгебр и подсчета таких элементов над конечными полями с применением компьютерной алгебры Sage Math. Полученные результаты могут быть полезны не только в развитии методов и средств комбинаторной и компьютерной алгебры, но также в построении сложных моделей физических процессов и в алгебраической теории кодирования. Эти результаты являются вкладом в фундаментальные основы математических методов интеллектуального анализа данных и искусственного интеллекта.
Полученные результаты исследований имеют широкий спектр применения и могут активно использоваться как в фундаментальной науке, так и в различных практических областях, таких как психология, медицина, робототехника и другие области, работающие с большими данными.
Ученые уверены, что междисциплинарный синтез алгебро-геометрических подходов и методов топологической, линейной и компьютерной алгебр способствует разработке эффективных алгоритмов решения сложных задач в различных областях науки и практики на основе методов интеллектуального анализа данных и средств искусственного интеллекта.
Результаты исследования были представлены на Всероссийской конференции «Актуальные проблемы и перспективы развития естественных и точных наук», которая проводилась в рамках Десятилетия науки и технологий.