• A
  • A
  • A
  • ABC
  • ABC
  • ABC
  • А
  • А
  • А
  • А
  • А
Regular version of the site

Introduction to Machine Learning

2024/2025
Academic Year
RUS
Instruction in Russian
3
ECTS credits
Delivered at:
Faculty of Physics
Course type:
Compulsory course
When:
2 year, 1 module

Программа дисциплины

Аннотация

Курс посвящён изучению основных методов машинного обучения. Изучаемые темы можно разбить на три блока. Первый — работа с данными и предварительный анализ данных. Изучаются библиотеки языка Python для работы с табличными данными и для визуализации, обсуждаются методы предобработки данных, подготовки категориальных и текстовых данных. Второй блок — обучение с учителем. Изучаются линейные модели, решающие деревья, композиции моделей (случайный лес, градиентный бустинг и его имплементации), приложения в рекомендательных системах. Третий блок — обучение без учителя. Изучаются методы кластеризации, визуализации, понижения размерности. Все темы сопровождаются практикой на реальных данных. По итогам курса слушатель сможет сформулировать задачу машинного обучения, выбрать метрику качества, обучить модель, подобрать гиперпараметры, провести валидацию.
Цель освоения дисциплины

Цель освоения дисциплины

  • Знает основные понятия и постановки задач машинного обучения
  • Знает теоретические основы линейных и логических методов машинного обучения
  • Знает принципы построения композиций моделей
  • Знает основные метрики качества для регрессии и классификации
  • Умеет выполнять полный цикл построения модели
  • Умеет обучать основные модели машинного обучения, оценивать их качества
  • Умеет выполнять кластеризацию и визуализацию данных
Планируемые результаты обучения

Планируемые результаты обучения

  • умеет решать задачи на данную тему
Содержание учебной дисциплины

Содержание учебной дисциплины

  • Введение. Примеры задач. Логические методы: решающие деревья и решающие леса.
  • Метрические методы классификации. Линейные методы, стохастический градиент.
  • Метод опорных векторов (SVM). Логистическая регрессия. Метрики качества классификации.
  • Линейная регрессия. Понижение размерности, метод главных компонент.
  • Композиции алгоритмов, градиентный бустинг. Нейронные сети.
  • Кластеризация и визуализация. Частичное обучение.
  • Прикладные задачи анализа данных: постановки и методы решения.
Элементы контроля

Элементы контроля

  • неблокирующий Экзамен
    Письменная работа
  • неблокирующий Контрольная работа
    письменная работа
Промежуточная аттестация

Промежуточная аттестация

  • 2024/2025 1st module
    0.5 * Контрольная работа + 0.5 * Экзамен
Список литературы

Список литературы

Рекомендуемая основная литература

  • 9781491912140 - Vanderplas, Jacob T. - Python Data Science Handbook : Essential Tools for Working with Data - 2016 - O'Reilly Media - https://search.ebscohost.com/login.aspx?direct=true&db=nlebk&AN=1425081 - nlebk - 1425081
  • Изучаем Python, Лутц, М., 2014
  • Шелудько, В. М. Основы программирования на языке высокого уровня Python : учебное пособие / В. М. Шелудько ; Южный федеральный университет. - Ростов-на-Дону ; Таганрог : Издательство Южного федерального университета, 2017. - 146 с. - ISBN 978-5-9275-2649-9. - Текст : электронный. - URL: https://new.znanium.com/catalog/product/1021662 - Текст : электронный. - URL: http://znanium.com/catalog/product/1021662

Рекомендуемая дополнительная литература

  • 9781785284571 - Romano, Fabrizio - Learning Python - 2015 - Packt Publishing - http://search.ebscohost.com/login.aspx?direct=true&db=nlebk&AN=1133614 - nlebk - 1133614
  • Bill Lubanovic. (2019). Introducing Python : Modern Computing in Simple Packages. [N.p.]: O’Reilly Media. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=2291494

Авторы

  • Джанибекова Сапият Хисаевна
  • Панкратова Елена Игоревна