2024/2025





Введение в машинное обучение
Статус:
Маго-лего
Кто читает:
Департамент филологии
Когда читается:
3, 4 модуль
Охват аудитории:
для своего кампуса
Преподаватели:
Фирсанова Виктория Игоревна
Язык:
русский
Кредиты:
6
Программа дисциплины
Аннотация
Целями освоения дисциплины является знакомство студентов с основными задачами и методами машинного обучения; применение методов машинного обучения для решения задач автоматической обработки текстов, умение пользоваться предобученными моделями и обучать собственные модели на разных типах данных.
Цель освоения дисциплины
- познакомить студентов с основными задачами и методами машинного обучения;
- научить применять машинное обучения для решения задач автоматической обработки текстов.
Планируемые результаты обучения
- анализирует преимущества и недостатки разных алгоритмов кластеризации, подбирает оптимальное количество классов
- использует предобученные модели для получения контекстных векторных представлений
- анализирует преимущества и недостатки разных алгоритмов классификации; обучает модели бинарной и многоклассовой классификации
- воспроизводит и интерпретирует основные термины и понятия, используемые в дальнейшем при освоении курса умеет анализировать функцию и построить график функций
- обучает регрессионные модели; понимает особенности использования различных регрессионных моделей.
- обучает случайный лес, градиентный бустинг, пользовуется xgboost, lightgbm и catboost, применяет стекинг; обучает нейронные классификаторы с использованием сверточных слоев в cnn, подбирает параметры в сверточных слоях
- обучает нейронные классификаторы с использованием рекуррентных слоев в keras (gru, lstm), обучает seq2seq модели, использует предобученные векторные представления; обучает нейронные классификаторы с использованием слоев Embedding, Dense в keras, выбирает нужную функцию потерь и оптимизатор
- обучает нейронные классификаторы с использованием рекуррентных слоев в rnn (gru, lstm), используя предобученные векторные представления
- обучает ранжирующие модели; оценивает результаты ранжирования
- разбивает выборку на обучающую и тестовую; разбивает выборку на фолды и производит кросс-валидацию
Содержание учебной дисциплины
- Введение. Понятие «машинное обучение».
- Классификация.
- Регрессия
- Валидация.
- Ансамбли.
- Кластеризация.
- Ранжирование.
- Нейронные сети (keras)
- Нейронные сети (cnn).
- Нейронные сети (rnn)
Элементы контроля
- ПроектНа итоговом контроле студент должен продемонстрировать владение основными навыками из пройденных тем дисциплины. Итоговый контроль проводится в форме индивидуального проекта. Проект подразумевает самостоятельное решение студентом практической задачи с помощью машинного обучения от начала (подготовка данных) и до конца (оценка качества и анализ ошибок, выбор лучшего метода). Студент может использовать как уже существующие данные, так и собрать всё самостоятельно. Темы должны быть заранее (не менее 3 недель до сдачи) согласованы с преподавателем. Проект сдаётся письменно. Оценка за проект выставляется по десятибалльной шкале.
- Домашнее заданиеДомашние задания представляют собой небольшие практические задания, которые выполняются студентами вне аудитории. Домашние работы сдаются за 2 дня до следующего занятия (до 23:59 предыдущего дня). После проверки заданий студенты получают обратную связь и оценку по своей работе по почте. Работы, которые были сданы после крайнего срока, штрафуются на три балла. Оценки за домашние задания выставляются в рабочую ведомость, перед экзаменом модуля оценки за домашние задания усредняются и выставляется единая средняя оценка по десятибалльной шкале. При необходимости осуществляется дистанционная поддержка контроля (выдача заданий, проверка работ и др.) с помощью электронных ресурсов филиала.
Промежуточная аттестация
- 2024/2025 4th module0.35 * Домашнее задание + 0.35 * Домашнее задание + 0.3 * Проект
Список литературы
Рекомендуемая основная литература
- Златопольский, Д. М. Основы программирования на языке Python / Д. М. Златопольский. — 2-ое изд., испр. и доп. — Москва : ДМК Пресс, 2018. — 396 с. — ISBN 978-5-97060-641-4. — Текст : электронный // Лань : электронно-библиотечная система. — URL: https://e.lanbook.com/book/131683 (дата обращения: 00.00.0000). — Режим доступа: для авториз. пользователей.
- Федоров, Д. Ю. Программирование на языке высокого уровня Python : учебное пособие для среднего профессионального образования / Д. Ю. Федоров. — 2-е изд. — Москва : Издательство Юрайт, 2019. — 161 с. — (Профессиональное образование). — ISBN 978-5-534-11961-9. — Текст : электронный // Образовательная платформа Юрайт [сайт]. — URL: https://urait.ru/bcode/446505 (дата обращения: 28.08.2023).
Рекомендуемая дополнительная литература
- Лучано, Р. Python. К вершинам мастерства / Р. Лучано , перевод с английского А. А. Слинкин. — Москва : ДМК Пресс, 2016. — 768 с. — ISBN 978-5-97060-384-0. — Текст : электронный // Лань : электронно-библиотечная система. — URL: https://e.lanbook.com/book/93273 (дата обращения: 00.00.0000). — Режим доступа: для авториз. пользователей.