Магистратура
2020/2021


Научно-исследовательский семинар "Методы интеллектуального анализа данных"
Статус:
Курс обязательный (Интеллектуальный анализ данных)
Направление:
01.04.02. Прикладная математика и информатика
Когда читается:
2-й курс, 1, 2 модуль
Формат изучения:
без онлайн-курса
Прогр. обучения:
Интеллектуальный анализ данных
Язык:
русский
Кредиты:
4
Контактные часы:
60
Программа дисциплины
Аннотация
Научно-исследовательский семинар представляет собой комплекс аудиторных и самостоятельных занятий, на которых участники знакомятся с последними достижениями науки о данных (Data Science) и изучают как разработать программные реализации по избранным темам. Главной темой семинаров 2019-2020 года является "Топологический анализ данных" (Topological Data Analysis-TDA).
Цель освоения дисциплины
- Целью семинара является вовлечение студентов в реальный процесс изучения новых результатов в науке о данных и процесса имплементации новых технологий в реальную практическую деятельность
Планируемые результаты обучения
- Ознакомление с конвейером топологического анализа и понимание основных топологических характеристик облака точек.
- Ознакомление с существом и особенностями топологического анализа данных и его примененений. понимание отличий топологических представлений данных от метрических моделей
- Знать основные инструментальные средства топологического анализа данных. Научиться выполнять топологический анализ на простых примерах.
- Получить практические навыки (умение) выполнять проект анализа текстов на естественном языке с применением топологического анализа данных
- Получить практические навыки (умение) выполнять проект анализа 2D и 3D изображений с применением топологического анализа данных
- Ознакомление с перспективами использования топологических моделей данных для традиционных задач нейронных сетей - классификации и поиска аномалий
Содержание учебной дисциплины
- Знакомство с терминологией и приложениями топологического анализа данных.Представление данных в метрическом пространстве. Метрики. Изометрия. Что такое топологические пространства. Примеры. Гомотопии. Основные понятия вычислительной топологии. Представление данных в топологическом пространстве.
- Программные билиотеки топологического анализа данных.Поиск и ознакомление с работой эффективных библиотек топологического анализа. Практическая работа с библиотеками на примерах известных наборов данных. Базовые библиотеки: Gudhi, Keppler-Mapper,
- Топологический анализ текстовых данныхРассматривается на сквозном примере анализа юридических и новостных текстов, На первом шаге конвейера производится эмбеддинг предложений с помощью нескольких известных моделей6 BERT, ELMO, USE, Далее образованное облако точек передается следующим ступеням обработки. Проекция, построение смплициального комплекса Чеха и кластеризация. Вычисляются персистентные диаграммы и кривая Бетти.
- Топологический анализ изображенийРассматривается задача трансформации изображений в графы и вычисление набора тпологических характеристик исходного трех или двумерного объекта. Строится процесс фильтрации точек изображеения и симплициального комплекса.
- Обучаемые модели классификации топологических структур.Рассматривается подход к построению обучаемых моделей классификации графов, в частности сверточная графовая нейронная сеть - CGN . Анализируется процесс распространения в такой сети и качество классификации графов.
- Технологии топологического анализа.Топологические симплексы и комплексы. Фильтрация и персистентные гомологии. Комплекс Чеха и и Ридса. Вычисление основных топологических характеристик по облаку точек в метрическом пространстве: числа Бетти персистентная диаграмма, Иллюстрация вычисления персистентных характеристик