• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта
Бакалавриат 2024/2025

Анализ данных и машинное обучение

Статус: Курс обязательный (Прикладная математика)
Направление: 01.03.04. Прикладная математика
Когда читается: 4-й курс, 1-3 модуль
Формат изучения: с онлайн-курсом
Онлайн-часы: 30
Охват аудитории: для своего кампуса
Язык: русский
Кредиты: 4

Программа дисциплины

Аннотация

Курс посвящён изучению основных методов машинного обучения. Рассматривается работа с данными и предварительный анализ данных. Изучаются библиотеки языка Python для работы с табличными данными и для визуализации, обсуждаются методы предобработки данных, подготовки категориальных и текстовых данных. Обучение с учителем. Изучаются линейные модели, решающие деревья, композиции моделей (случайный лес, градиентный бустинг и его имплементации), приложения в рекомендательных системах. Обучение без учителя. Изучаются методы кластеризации, визуализации, понижения размерности. Все темы сопровождаются практикой на реальных данных.
Цель освоения дисциплины

Цель освоения дисциплины

  • Целями освоения дисциплины «Машинное обучение и анализ данных» являются: знакомство с фундаментальными понятиями и математическим аппаратом теории машинного обучения и анализа данных; изучение основных задач из области машинного обучения и методов их решения, формирование навыков эффективного применения изученных методов для решения задач профессиональной области.
Планируемые результаты обучения

Планируемые результаты обучения

  • Знать и уметь интерпретировать и понимать смысл основных математических понятий и объектов.
  • Уметь использовать основные библиотеки Python, полезныe для анализа данных, например, NumPy, SciPy, Matplotlib и Pandas.
  • Знать и уметь применять статистические методы для анализа данных
  • Знать и уметь применять на практике алгоритмы классификации и регрессии: линейные модели, нейронные сети, решающие деревья, случайные леса, метод градиентного бустинга.
  • Уметь строить матричные разложения , понижать размерность данных, искать аномалии и визуализировать многомерные данные.
  • Знать основные типы прикладных задач анализа данных. Знать, понимать и уметь применять схемы их решения.
Содержание учебной дисциплины

Содержание учебной дисциплины

  • Инструменты анализа данных
  • Статистический анализ данных
  • Обучение на размеченных данных
  • Поиск структуры в данных
  • Прикладные задачи анализа данных
Элементы контроля

Элементы контроля

  • неблокирующий Работа на лекциях
    Присутствие, ответы на вопросы, выполнение заданий, участие в обсуждениях и дискуссиях.
  • неблокирующий Работа на лекциях
    Присутствие, ответы на вопросы, выполнение заданий, участие в обсуждениях и дискуссиях.
  • неблокирующий Работа на семинарах
    Присутствие, ответы на вопросы, выполнение заданий, участие в обсуждениях и дискуссиях.
  • неблокирующий Домашние работы
    Студент выполняет и сдает определенное количество домашних работ. Суммарные баллы за них нормируются. За каждую домашнюю рпботу студент может получить от 0 до 10 баллов
  • неблокирующий Контрольные работы
    Студент выполняет либо аудиторные, либо домашние контрольные. За каждую работу студент может получить от 0 до 10 баллов. Суммарные баллы нормируются
  • неблокирующий Проект
    Индивидуальный или групповой проект. Максимум 10 баллов
  • неблокирующий Письменный экзамен
    Письменный экзамен
  • неблокирующий Работа на семинарах
    Присутствие, ответы на вопросы, выполнение заданий, участие в обсуждениях и дискуссиях.
  • неблокирующий Работа на семинарах
    Присутствие, ответы на вопросы, выполнение заданий, участие в обсуждениях и дискуссиях.
  • неблокирующий Домашние задания
    Студент выполняет и сдает определенное количество домашних работ. Суммарные баллы за них нормируются. За каждую домашнюю работу студент может получить от 0 до 10 баллов
  • неблокирующий Домашние задания
  • неблокирующий Контрольные работы
    Студент выполняет либо аудиторные, либо домашние контрольные. За каждую работу студент может получить от 0 до 10 баллов. Суммарные баллы нормируются
  • неблокирующий Контрольные работы
    Студент выполняет либо аудиторные, либо домашние контрольные. За каждую работу студент может получить от 0 до 10 баллов. Суммарные баллы нормируются
Промежуточная аттестация

Промежуточная аттестация

  • 2024/2025 2nd module
    0.15 * Домашние задания + 0.15 * Домашние задания + 0.25 * Контрольные работы + 0.25 * Контрольные работы + 0.05 * Работа на лекциях + 0.05 * Работа на лекциях + 0.05 * Работа на семинарах + 0.05 * Работа на семинарах
  • 2024/2025 3rd module
    0.1 * Домашние работы + 0.1 * Контрольные работы + 0.6 * Письменный экзамен + 0.15 * Проект + 0.05 * Работа на семинарах
Список литературы

Список литературы

Рекомендуемая основная литература

  • Python. Исчерпывающее руководство. - 978-5-4461-1956-1 - Бизли Дэвид - 2023 - Санкт-Петербург: Питер - https://ibooks.ru/bookshelf/386795 - 386795 - iBOOKS
  • Анализ данных : учебник для вузов / В. С. Мхитарян [и др.] ; под редакцией В. С. Мхитаряна. — Москва : Издательство Юрайт, 2023. — 490 с. — (Высшее образование). — ISBN 978-5-534-00616-2. — Текст : электронный // Образовательная платформа Юрайт [сайт]. — URL: https://urait.ru/bcode/511020 (дата обращения: 27.08.2024).
  • Глубокое обучение на Python. 2-е межд. издание. - 978-5-4461-1909-7 - Шолле Франсуа - 2023 - Санкт-Петербург: Питер - https://ibooks.ru/bookshelf/386793 - 386793 - iBOOKS
  • Интерпретируемое машинное обучение на Python: Пер. с англ. - 978-5-9775-1735-5 - Масис С. - 2023 - Санкт-Петербург: БХВ-Петербург - https://ibooks.ru/bookshelf/389646 - 389646 - iBOOKS
  • Кремер, Н. Ш.  Линейная алгебра : учебник и практикум для вузов / Н. Ш. Кремер, М. Н. Фридман, И. М. Тришин ; под редакцией Н. Ш. Кремера. — 3-е изд., испр. и доп. — Москва : Издательство Юрайт, 2023. — 422 с. — (Высшее образование). — ISBN 978-5-534-08547-1. — Текст : электронный // Образовательная платформа Юрайт [сайт]. — URL: https://urait.ru/bcode/510867 (дата обращения: 27.08.2024).
  • Криволапов, С. Я., Математика на Python : учебник / С. Я. Криволапов, М. Б. Хрипунова. — Москва : КноРус, 2024. — 455 с. — ISBN 978-5-406-12069-9. — URL: https://book.ru/book/950432 (дата обращения: 27.08.2024). — Текст : электронный.
  • Маккинни, У. Python и анализ данных. Первичная обработка данных с применением pandas, NumPy и Jupiter : справочник / У. Маккинни , перевод с английского А. А. Слинкина. — 3-е изд. — Москва : ДМК Пресс, 2023. — 536 с. — ISBN 978-5-93700-174-0. — Текст : электронный // Лань : электронно-библиотечная система. — URL: https://e.lanbook.com/book/348086 (дата обращения: 00.00.0000). — Режим доступа: для авториз. пользователей.
  • Математический анализ и дискретная математика : учебное пособие для вузов / Е. Г. Плотникова, С. В. Левко, В. В. Логинова, Г. М. Хакимова ; под общей редакцией Е. Г. Плотниковой. — 2-е изд., перераб. и доп. — Москва : Издательство Юрайт, 2023. — 300 с. — (Высшее образование). — ISBN 978-5-534-07545-8. — Текст : электронный // Образовательная платформа Юрайт [сайт]. — URL: https://urait.ru/bcode/515514 (дата обращения: 27.08.2024).
  • Платонов, А. В.  Машинное обучение : учебное пособие для вузов / А. В. Платонов. — Москва : Издательство Юрайт, 2023. — 85 с. — (Высшее образование). — ISBN 978-5-534-15561-7. — Текст : электронный // Образовательная платформа Юрайт [сайт]. — URL: https://urait.ru/bcode/520544 (дата обращения: 27.08.2024).
  • Чернышев, С. А., Алгоритмы и структуры данных на Python : учебное пособие / С. А. Чернышев. — Москва : КноРус, 2024. — 326 с. — ISBN 978-5-406-11683-8. — URL: https://book.ru/book/949701 (дата обращения: 27.08.2024). — Текст : электронный.
  • Шипачев, В. С. Математический анализ. Теория и практика : учебное пособие / В. С. Шипачев. — 3-е изд. — Москва : ИНФРА-М, 2023. — 351 с. — (Высшее образование). — DOI 10.12737/5267. - ISBN 978-5-16-010073-9. - Текст : электронный. - URL: https://znanium.com/catalog/product/1911211

Рекомендуемая дополнительная литература

  • Berk, R. A. (2008). Statistical Learning From a Regression Perspective. New York, NY: Springer. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=254950
  • Discrete Mathematics for Computer Science - CCBY4_028 - Mark A. Fitch - 2022 - Open Educational Resources: libretexts.org - https://ibooks.ru/bookshelf/390548 - 390548 - iBOOKS
  • Hastie, T., Tibshirani, R., & Friedman, J. H. (2009). The Elements of Statistical Learning : Data Mining, Inference, and Prediction (Vol. Second edition, corrected 7th printing). New York: Springer. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=277008
  • Hastie, T., Tibshirani, R., Friedman, J. The elements of statistical learning: Data Mining, Inference, and Prediction. – Springer, 2009. – 745 pp.
  • James, G. et al. An introduction to statistical learning. – Springer, 2013. – 426 pp.
  • Python без проблем: решаем реальные задачи и пишем полезный код. - 978-5-4461-1920-2 - Зингаро Даниэль - 2023 - Санкт-Петербург: Питер - https://ibooks.ru/bookshelf/386794 - 386794 - iBOOKS
  • Python для сложных задач: наука о данных и машинное обучение. - 978-5-4461-0914-2 - Плас Дж. Вандер - 2021 - Санкт-Петербург: Питер - https://ibooks.ru/bookshelf/376830 - 376830 - iBOOKS
  • Линейная алгебра в примерах и задачах - Бортаковский А.С., Пантелеев А.В. - НИЦ ИНФРА-М - 2023 - https://znanium.com/catalog/product/1907364 - 1455020 - ZNANIUM
  • Макаров, С. И., Высшая математика: математический анализ и линейная алгебра : учебное пособие / С. И. Макаров. — Москва : КноРус, 2023. — 320 с. — ISBN 978-5-406-11035-5. — URL: https://book.ru/book/947276 (дата обращения: 27.08.2024). — Текст : электронный.
  • Мэрфи, К. П. Вероятностное машинное обучение. Введение / К. П. Мэрфи , перевод с английского А. А. Слинкина. — Москва : ДМК Пресс, 2022. — 940 с. — ISBN 978-5-93700-119-1. — Текст : электронный // Лань : электронно-библиотечная система. — URL: https://e.lanbook.com/book/314891 (дата обращения: 00.00.0000). — Режим доступа: для авториз. пользователей.
  • Шагин, В. Л.  Математический анализ. Базовые понятия : учебное пособие для вузов / В. Л. Шагин, А. В. Соколов. — Москва : Издательство Юрайт, 2023. — 245 с. — (Высшее образование). — ISBN 978-5-534-00884-5. — Текст : электронный // Образовательная платформа Юрайт [сайт]. — URL: https://urait.ru/bcode/512337 (дата обращения: 27.08.2024).
  • Шень, А. Вероятность: примеры и задачи : учебное пособие / А. Шень. — 2-е изд., стер. — Москва : МЦНМО, 2008. — 64 с. — ISBN 978-5-94057-284-8. — Текст : электронный // Лань : электронно-библиотечная система. — URL: https://e.lanbook.com/book/9442 (дата обращения: 00.00.0000). — Режим доступа: для авториз. пользователей.

Авторы

  • Попов Виктор Юрьевич