Магистратура
2021/2022





Научно-исследовательский семинар "Методы интеллектуального анализа данных"
Лучший по критерию «Полезность курса для расширения кругозора и разностороннего развития»
Лучший по критерию «Новизна полученных знаний»
Статус:
Курс обязательный (Интеллектуальный анализ данных)
Направление:
01.04.02. Прикладная математика и информатика
Когда читается:
2-й курс, 1, 2 модуль
Формат изучения:
без онлайн-курса
Охват аудитории:
для своего кампуса
Преподаватели:
Крылов Владимир Владимирович
Прогр. обучения:
Интеллектуальный анализ данных
Язык:
русский
Кредиты:
4
Контактные часы:
60
Программа дисциплины
Аннотация
Научно-исследовательский семинар представляет собой комплекс аудиторных и самостоятельных занятий, на которых участники знакомятся с последними достижениями науки о данных (Data Science) и изучают как разработать программные реализации по избранным темам. Главной темой семинаров 2019-2020 года является "Топологический анализ данных" (Topological Data Analysis-TDA).
Цель освоения дисциплины
- Знакомство студентов с современными программными библиотеками, предназначенными для анализа мультимедийных данных
- Целью семинара является вовлечение студентов в реальный процесс изучения новых результатов в науке о данных и процесса имплементации новых технологий в реальную практическую деятельность
- Получение необходимых знаний и навыков для выполнения научно-исследовательских проектов на примере создания интеллектуальных систем анализа данных
- Приобретение умений поиска и анализа современных научных публикаций по методам интеллектуального анализа данных.
Планируемые результаты обучения
- Применяет методы обработки изображений лиц (детектирование, верификация, идентификация), видео людей.
- Применяет методы переноса знаний (transfer learning), локальные дескрипторы и структурные методы для решения задач распознавания изображений.
- Применяет на практике современные методы обработки изображений (детектирование объектов, сегментация и синтез изображений).
- Сравнивает и применяет нейросетевые модели распознавания речи. Интерпретирует методы распознавания и верификации диктора по звучащей речи.
- Знать основные инструментальные средства топологического анализа данных. Научиться выполнять топологический анализ на простых примерах.
- Ознакомление с конвейером топологического анализа и понимание основных топологических характеристик облака точек.
- Ознакомление с перспективами использования топологических моделей данных для традиционных задач нейронных сетей - классификации и поиска аномалий
- Ознакомление с существом и особенностями топологического анализа данных и его примененений. понимание отличий топологических представлений данных от метрических моделей
- Получить практические навыки (умение) выполнять проект анализа 2D и 3D изображений с применением топологического анализа данных
- Получить практические навыки (умение) выполнять проект анализа текстов на естественном языке с применением топологического анализа данных
Содержание учебной дисциплины
- Знакомство с терминологией и приложениями топологического анализа данных.
- Методы переноса знаний (transfer learning) для распознавания изображений. Локальные дескрипторы ключевых точек изображений. Структурные методы распознавания образов на основе теории графов.
- Программные билиотеки топологического анализа данных.
- Детектирование объектов на изображениях и видео. Семантическая сегментация изображений. Синтез изображений. Обработка изображений лиц (детектирование, верификация, идентификация, распознавание эмоций, пола, возраста ).
- Топологический анализ текстовых данных
- Обработка изображений/видео людей (включая реидентификацию и распознавание действий). Методы повышения эффективности и оптимизации методов принятия решений и нейронных сетей. Прикладные задачи в области понимания изображений (image captioning, question answering, driver assistance, game playing).
- Топологический анализ изображений
- Обработка речевых сигналов (в том числе очистка от шума). Нейросетевые модели распознавания речи. Синтез речи. Методы распознавания и верификации диктора по звучащей речи.
- Обучаемые модели классификации топологических структур.
- Технологии топологического анализа.
Элементы контроля
- лабораторные работы
- устный экзаменЭкзамен проводится в устной форме (опрос по проекту "Экзаменационные задания"). Экзамен проводится на платформе Zoom ( https://zoom.us/j/4917538372). К экзамену необходимо подключиться согласно расписанию ответов, высланному преподавателем на корпоративные почты студентов накануне экзамена. Компьютер студента должен удовлетворять требованиям: наличие рабочей камеры и микрофона, поддержка Zoom. Для участия в экзамене студент обязан: поставить на аватар свою фотографию, явиться на экзамен согласно точному расписанию, при ответе включить камеру и микрофон. Во время экзамена студентам запрещено: выключать камеру, пользоваться конспектами и подсказками. Кратковременным нарушением связи во время экзамена считается нарушение связи до 5 минут. Долговременным нарушением связи во время экзамена считается нарушение 5 минут и более. При долговременном нарушении связи студент не может продолжить участие в экзамене. Процедура пересдачи аналогична процедуре сдачи.
- лабораторные работы
- устный экзаменЭкзамен проводится в устной форме (опрос по проекту "Экзаменационные задания"). Экзамен проводится на платформе Zoom ( https://zoom.us/j/4917538372). К экзамену необходимо подключиться согласно расписанию ответов, высланному преподавателем на корпоративные почты студентов накануне экзамена. Компьютер студента должен удовлетворять требованиям: наличие рабочей камеры и микрофона, поддержка Zoom. Для участия в экзамене студент обязан: поставить на аватар свою фотографию, явиться на экзамен согласно точному расписанию, при ответе включить камеру и микрофон. Во время экзамена студентам запрещено: выключать камеру, пользоваться конспектами и подсказками. Кратковременным нарушением связи во время экзамена считается нарушение связи до 5 минут. Долговременным нарушением связи во время экзамена считается нарушение 5 минут и более. При долговременном нарушении связи студент не может продолжить участие в экзамене. Процедура пересдачи аналогична процедуре сдачи.
- Экзамен
- доклад
- Экзамен
- доклад
Промежуточная аттестация
- 2020/2021 учебный год 4 модуль0.5 * устный экзамен + 0.5 * лабораторные работы
- 2021/2022 учебный год 2 модуль0.3 * доклад + 0.7 * Экзамен
Список литературы
Рекомендуемая основная литература
- Christopher M. Bishop. (n.d.). Australian National University Pattern Recognition and Machine Learning. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsbas&AN=edsbas.EBA0C705
- Witten, I. H. et al. Data Mining: Practical machine learning tools and techniques. – Morgan Kaufmann, 2017. – 654 pp.
- Антонио, Д. Библиотека Keras – инструмент глубокого обучения. Реализация нейронных сетей с помощью библиотек Theano и TensorFlow / Д. Антонио, П. Суджит ; перевод с английского А. А. Слинкин. — Москва : ДМК Пресс, 2018. — 294 с. — ISBN 978-5-97060-573-8. — Текст : электронный // Лань : электронно-библиотечная система. — URL: https://e.lanbook.com/book/111438 (дата обращения: 00.00.0000). — Режим доступа: для авториз. пользователей.
- Вычислительная топология, учебник, 213 с., Яковлев, Е. И., 2005
- Ростовцев В.С. - Искусственные нейронные сети: учебник - Издательство "Лань" - 2019 - 216с. - ISBN: 978-5-8114-3768-9 - Текст электронный // ЭБС ЛАНЬ - URL: https://e.lanbook.com/book/122180
- Селянкин В.В. - Компьютерное зрение. Анализ и обработка изображений: учебное пособие - Издательство "Лань" - 2019 - 152с. - ISBN: 978-5-8114-3368-1 - Текст электронный // ЭБС ЛАНЬ - URL: https://e.lanbook.com/book/113938
- Топология для младшекурсников, [учебник], 159 с., Васильев, В. А., 2014
Рекомендуемая дополнительная литература
- Mariani, J. (2009). Language and Speech Processing. London, UK: Wiley-ISTE. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=310778
- Webb, A. R. Statistical pattern recognition. – John Wiley & Sons, 20011. – 668 pp.
- Аллен, Б. Д. Think DSP. Цифровая обработка сигналов на Python / Б. Д. Аллен ; перевод с английского А. Э. Бряндинский. — Москва : ДМК Пресс, 2017. — 160 с. — ISBN 978-5-97060-454-0. — Текст : электронный // Лань : электронно-библиотечная система. — URL: https://e.lanbook.com/book/93566 (дата обращения: 00.00.0000). — Режим доступа: для авториз. пользователей.
- Броневич, А. Г. Анализ неопределенности выделения информативных признаков и представлений изображений : монография / А. Г. Броневич, А. Н. Каркищенко, А. Е. Лепский. — Москва : ФИЗМАТЛИТ, 2013. — 320 с. — ISBN 978-5-9221-1499-8. — Текст : электронный // Лань : электронно-библиотечная система. — URL: https://e.lanbook.com/book/59666 (дата обращения: 00.00.0000). — Режим доступа: для авториз. пользователей.
- Волков В.Ю. - Адаптивные и инвариантные алгоритмы обнаружения объектов на изображениях и их моделирование в Matlab - Издательство "Лань" - 2014 - 192с. - ISBN: 978-5-8114-1656-1 - Текст электронный // ЭБС ЛАНЬ - URL: https://e.lanbook.com/book/68475
- Столов Е.Л. - Цифровая обработка сигналов. Водяные знаки в аудиофайлах: учебное пособие - Издательство "Лань" - 2018 - 176с. - ISBN: 978-5-8114-3014-7 - Текст электронный // ЭБС ЛАНЬ - URL: https://e.lanbook.com/book/106736