Бакалавриат
2022/2023
Научно-исследовательский семинар "Технологии компьютерного зрения"
Лучший по критерию «Новизна полученных знаний»
Статус:
Курс по выбору (Программная инженерия)
Направление:
09.03.04. Программная инженерия
Кто читает:
Департамент программной инженерии
Где читается:
Факультет компьютерных наук
Когда читается:
4-й курс, 1-3 модуль
Формат изучения:
без онлайн-курса
Охват аудитории:
для всех кампусов НИУ ВШЭ
Преподаватели:
Ганичев Антон Александрович
Язык:
русский
Кредиты:
3
Контактные часы:
44
Программа дисциплины
Аннотация
Компьютерное зрение - это раздел искусственного интеллекта связанный с анализом визуальных данных. Он включает методы позволяющие производить обнаружение, отслеживание и классификацию объектов на изображениях и в видеопотоке. Технологии компьютерного зрения находят применение в
- Робототехнике: промышленные роботы, автономные транспортные средства;
- Системах безопасности: контроль доступа, распознавание лиц, обнаружение подозрительного поведения;
- Здравоохранении: анализ медицинских изображений, топографическое моделирование;
- Системах взаимодействия и дополненной реальности: поиск по изображениям, аннотация, ввода информации
В последние годы в области компьютерного зрения достигнут значительный прогресс. Он связан с прежде всего с технологиями глубокого обучения (Deep learning) которые будут рассматриваться в рамках данного семинара.
Цель освоения дисциплины
- Обеспечить студентов базовыми знаниями о технологиях применяющихся для анализа изображений и видео
- Заложить основы знаний об архитектурах и способах обучения сверточных нейросетей (CNN)
- Познакомить студентов с основными программными и аппаратными средствами применяющимися для создания и обучения CNN
Планируемые результаты обучения
- Знать принцип работы основных алгоритмов детектирования объектов.
- Понимать принцип работы линейного классификатора, знать алгоритмы kNN, SVM
- Понимать принцип работы сверточной нейросети. Знать алгоритм обратного распространения.
- Уметь самостоятельно обучить нейросетевой классификатор.
Содержание учебной дисциплины
- Анализ изображений.
- Линейный классификатор.
- Обратное распространение и алгоритмы оптимизации
- Сверточная нейронная сеть и методы улучшения сходимости.
- Архитектуры СNN & ViT
- Работа с реальными данными
- Генеративные модели
- Metric lerning
- Сегментация изображений.
Элементы контроля
- ДокладВыполненные в ходе подготовки доклада эксперименты могут быть зачтены в качестве выполнения практических задач (см. пункт "Работа на семинаре"). Оценка за дисциплину выставляется в соответствии с формулой оценивания от всех пройденных элементов контроля. Экзамен не проводится.
- Работа на семинареВключает: участие в обсуждении, ответы на вопросы и выполнение практических заданий (см пример).
Список литературы
Рекомендуемая основная литература
- McKinney, W. (2018). Python for Data Analysis : Data Wrangling with Pandas, NumPy, and IPython (Vol. Second edition). Sebastopol, CA: O’Reilly Media. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=1605925
- Коэльо, Л. П. Построение систем машинного обучения на языке Python / Л. П. Коэльо, В. Ричарт , перевод с английского А. А. Слинкин. — 2-е изд. — Москва : ДМК Пресс, 2016. — 302 с. — ISBN 978-5-97060-330-7. — Текст : электронный // Лань : электронно-библиотечная система. — URL: https://e.lanbook.com/book/82818 (дата обращения: 00.00.0000). — Режим доступа: для авториз. пользователей.
Рекомендуемая дополнительная литература
- Основы алгоритмизации и программирования на Python : учеб. пособие / С.Р. Гуриков. — М. : ФОРУМ : ИНФРА-М, 2019. — 343 с. — (Среднее профессиональное образование). - Режим доступа: http://znanium.com/catalog/product/970143