• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Бакалаврская программа «Прикладная математика и информатика»

01
Февраль

Машинное обучение для больших данных

2024/2025
Учебный год
RUS
Обучение ведется на русском языке
4
Кредиты
Статус:
Курс обязательный
Когда читается:
4-й курс, 3 модуль

Преподаватель


Анищенко Илья Игоревич

Программа дисциплины

Аннотация

Дисциплина знакомит студентов с основными задачами машинного обучения на больших данных, их особенностями и ограничениями.
Цель освоения дисциплины

Цель освоения дисциплины

  • Ознакомление студентов с основными задачами машинного обучения на больших данных, их особенностями и ограничениями
Планируемые результаты обучения

Планируемые результаты обучения

  • Владеть инструментами обработки данных в парадигме MapReduce
  • Знать особенности распараллеливания алгоритмов машинного обучения для применения на больших данных
  • Уметь работать с большими данными в реальных задачах
Содержание учебной дисциплины

Содержание учебной дисциплины

  • Hadoop
  • Spark
  • Linear models
  • Boosting
  • Recommender systems
  • Neural networks
  • Hashing tricks
  • Min hash & LSH
  • Spark streaming and Kafka
  • Catboost
Элементы контроля

Элементы контроля

  • неблокирующий Мини-домашнее задание 1
    Работа с облаком Алгоритм на Bash
  • неблокирующий Мини-домашнее задание 2
    Алгоритм на Map Reduce Алгоритмы на Spark
  • неблокирующий Мини-домашнее задание 3
    Более продвинутые задачи по работе на Spark Собрать признаки из имеющихся данных
  • неблокирующий Большое домашнее задание
    Обучить модель на большом датасете
  • неблокирующий Мини-домашнее задание 4
    Собрать датасет на Spark Обучить классическую модель
Промежуточная аттестация

Промежуточная аттестация

  • 2024/2025 3rd module
    Итог = 0.125*(МДЗ1 + МДЗ2 + МДЗ3 + МДЗ4) + 0.5*ДЗ
Список литературы

Список литературы

Рекомендуемая основная литература

  • An Introduction to the Bootstrap, Efron, B., 1993
  • Hastie, T., Tibshirani, R., & Friedman, J. H. (2009). The Elements of Statistical Learning : Data Mining, Inference, and Prediction (Vol. Second edition, corrected 7th printing). New York: Springer. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=277008

Рекомендуемая дополнительная литература

  • Murphy, K. P. (2012). Machine Learning : A Probabilistic Perspective. Cambridge, Mass: The MIT Press. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=480968
  • Машинное обучение : наука и искусство построения алгоритмов, которые извлекают знания из данных, Флах, П., 2015

Авторы

  • Зимовнов Андрей Вадимович