Бакалавриат
2024/2025
Анализ данных и машинное обучение
Статус:
Курс обязательный (Прикладная математика)
Направление:
01.03.04. Прикладная математика
Кто читает:
Департамент прикладной математики
Когда читается:
4-й курс, 1-3 модуль
Формат изучения:
с онлайн-курсом
Онлайн-часы:
30
Охват аудитории:
для своего кампуса
Язык:
русский
Кредиты:
4
Программа дисциплины
Аннотация
Курс посвящён изучению основных методов машинного обучения. Рассматривается работа с данными и предварительный анализ данных. Изучаются библиотеки языка Python для работы с табличными данными и для визуализации, обсуждаются методы предобработки данных, подготовки категориальных и текстовых данных. Обучение с учителем. Изучаются линейные модели, решающие деревья, композиции моделей (случайный лес, градиентный бустинг и его имплементации), приложения в рекомендательных системах. Обучение без учителя. Изучаются методы кластеризации, визуализации, понижения размерности. Все темы сопровождаются практикой на реальных данных.
Цель освоения дисциплины
- Целями освоения дисциплины «Машинное обучение и анализ данных» являются: знакомство с фундаментальными понятиями и математическим аппаратом теории машинного обучения и анализа данных; изучение основных задач из области машинного обучения и методов их решения, формирование навыков эффективного применения изученных методов для решения задач профессиональной области.
Планируемые результаты обучения
- Знать и уметь интерпретировать и понимать смысл основных математических понятий и объектов.
- Уметь использовать основные библиотеки Python, полезныe для анализа данных, например, NumPy, SciPy, Matplotlib и Pandas.
- Знать и уметь применять статистические методы для анализа данных
- Знать и уметь применять на практике алгоритмы классификации и регрессии: линейные модели, нейронные сети, решающие деревья, случайные леса, метод градиентного бустинга.
- Уметь строить матричные разложения , понижать размерность данных, искать аномалии и визуализировать многомерные данные.
- Знать основные типы прикладных задач анализа данных. Знать, понимать и уметь применять схемы их решения.
Содержание учебной дисциплины
- Инструменты анализа данных
- Статистический анализ данных
- Обучение на размеченных данных
- Поиск структуры в данных
- Прикладные задачи анализа данных
Элементы контроля
- Работа на лекцияхПрисутствие, ответы на вопросы, выполнение заданий, участие в обсуждениях и дискуссиях.
- Работа на лекцияхПрисутствие, ответы на вопросы, выполнение заданий, участие в обсуждениях и дискуссиях.
- Работа на семинарахПрисутствие, ответы на вопросы, выполнение заданий, участие в обсуждениях и дискуссиях.
- Домашние работыСтудент выполняет и сдает определенное количество домашних работ. Суммарные баллы за них нормируются. За каждую домашнюю рпботу студент может получить от 0 до 10 баллов
- Контрольные работыСтудент выполняет либо аудиторные, либо домашние контрольные. За каждую работу студент может получить от 0 до 10 баллов. Суммарные баллы нормируются
- ПроектИндивидуальный или групповой проект. Максимум 10 баллов
- Письменный экзаменПисьменный экзамен
- Работа на семинарахПрисутствие, ответы на вопросы, выполнение заданий, участие в обсуждениях и дискуссиях.
- Работа на семинарахПрисутствие, ответы на вопросы, выполнение заданий, участие в обсуждениях и дискуссиях.
- Домашние заданияСтудент выполняет и сдает определенное количество домашних работ. Суммарные баллы за них нормируются. За каждую домашнюю работу студент может получить от 0 до 10 баллов
- Домашние задания
- Контрольные работыСтудент выполняет либо аудиторные, либо домашние контрольные. За каждую работу студент может получить от 0 до 10 баллов. Суммарные баллы нормируются
- Контрольные работыСтудент выполняет либо аудиторные, либо домашние контрольные. За каждую работу студент может получить от 0 до 10 баллов. Суммарные баллы нормируются
Промежуточная аттестация
- 2024/2025 2nd module0.15 * Домашние задания + 0.15 * Домашние задания + 0.25 * Контрольные работы + 0.25 * Контрольные работы + 0.05 * Работа на лекциях + 0.05 * Работа на лекциях + 0.05 * Работа на семинарах + 0.05 * Работа на семинарах
- 2024/2025 3rd module0.1 * Домашние работы + 0.1 * Контрольные работы + 0.6 * Письменный экзамен + 0.15 * Проект + 0.05 * Работа на семинарах
Список литературы
Рекомендуемая основная литература
- Python. Исчерпывающее руководство. - 978-5-4461-1956-1 - Бизли Дэвид - 2023 - Санкт-Петербург: Питер - https://ibooks.ru/bookshelf/386795 - 386795 - iBOOKS
- Анализ данных : учебник для вузов / В. С. Мхитарян [и др.] ; под редакцией В. С. Мхитаряна. — Москва : Издательство Юрайт, 2023. — 490 с. — (Высшее образование). — ISBN 978-5-534-00616-2. — Текст : электронный // Образовательная платформа Юрайт [сайт]. — URL: https://urait.ru/bcode/511020 (дата обращения: 27.08.2024).
- Глубокое обучение на Python. 2-е межд. издание. - 978-5-4461-1909-7 - Шолле Франсуа - 2023 - Санкт-Петербург: Питер - https://ibooks.ru/bookshelf/386793 - 386793 - iBOOKS
- Интерпретируемое машинное обучение на Python: Пер. с англ. - 978-5-9775-1735-5 - Масис С. - 2023 - Санкт-Петербург: БХВ-Петербург - https://ibooks.ru/bookshelf/389646 - 389646 - iBOOKS
- Кремер, Н. Ш. Линейная алгебра : учебник и практикум для вузов / Н. Ш. Кремер, М. Н. Фридман, И. М. Тришин ; под редакцией Н. Ш. Кремера. — 3-е изд., испр. и доп. — Москва : Издательство Юрайт, 2023. — 422 с. — (Высшее образование). — ISBN 978-5-534-08547-1. — Текст : электронный // Образовательная платформа Юрайт [сайт]. — URL: https://urait.ru/bcode/510867 (дата обращения: 27.08.2024).
- Криволапов, С. Я., Математика на Python : учебник / С. Я. Криволапов, М. Б. Хрипунова. — Москва : КноРус, 2024. — 455 с. — ISBN 978-5-406-12069-9. — URL: https://book.ru/book/950432 (дата обращения: 27.08.2024). — Текст : электронный.
- Маккинни, У. Python и анализ данных. Первичная обработка данных с применением pandas, NumPy и Jupiter : справочник / У. Маккинни , перевод с английского А. А. Слинкина. — 3-е изд. — Москва : ДМК Пресс, 2023. — 536 с. — ISBN 978-5-93700-174-0. — Текст : электронный // Лань : электронно-библиотечная система. — URL: https://e.lanbook.com/book/348086 (дата обращения: 00.00.0000). — Режим доступа: для авториз. пользователей.
- Математический анализ и дискретная математика : учебное пособие для вузов / Е. Г. Плотникова, С. В. Левко, В. В. Логинова, Г. М. Хакимова ; под общей редакцией Е. Г. Плотниковой. — 2-е изд., перераб. и доп. — Москва : Издательство Юрайт, 2023. — 300 с. — (Высшее образование). — ISBN 978-5-534-07545-8. — Текст : электронный // Образовательная платформа Юрайт [сайт]. — URL: https://urait.ru/bcode/515514 (дата обращения: 27.08.2024).
- Платонов, А. В. Машинное обучение : учебное пособие для вузов / А. В. Платонов. — Москва : Издательство Юрайт, 2023. — 85 с. — (Высшее образование). — ISBN 978-5-534-15561-7. — Текст : электронный // Образовательная платформа Юрайт [сайт]. — URL: https://urait.ru/bcode/520544 (дата обращения: 27.08.2024).
- Чернышев, С. А., Алгоритмы и структуры данных на Python : учебное пособие / С. А. Чернышев. — Москва : КноРус, 2024. — 326 с. — ISBN 978-5-406-11683-8. — URL: https://book.ru/book/949701 (дата обращения: 27.08.2024). — Текст : электронный.
- Шипачев, В. С. Математический анализ. Теория и практика : учебное пособие / В. С. Шипачев. — 3-е изд. — Москва : ИНФРА-М, 2023. — 351 с. — (Высшее образование). — DOI 10.12737/5267. - ISBN 978-5-16-010073-9. - Текст : электронный. - URL: https://znanium.com/catalog/product/1911211
Рекомендуемая дополнительная литература
- Berk, R. A. (2008). Statistical Learning From a Regression Perspective. New York, NY: Springer. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=254950
- Discrete Mathematics for Computer Science - CCBY4_028 - Mark A. Fitch - 2022 - Open Educational Resources: libretexts.org - https://ibooks.ru/bookshelf/390548 - 390548 - iBOOKS
- Hastie, T., Tibshirani, R., & Friedman, J. H. (2009). The Elements of Statistical Learning : Data Mining, Inference, and Prediction (Vol. Second edition, corrected 7th printing). New York: Springer. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=277008
- Hastie, T., Tibshirani, R., Friedman, J. The elements of statistical learning: Data Mining, Inference, and Prediction. – Springer, 2009. – 745 pp.
- James, G. et al. An introduction to statistical learning. – Springer, 2013. – 426 pp.
- Python без проблем: решаем реальные задачи и пишем полезный код. - 978-5-4461-1920-2 - Зингаро Даниэль - 2023 - Санкт-Петербург: Питер - https://ibooks.ru/bookshelf/386794 - 386794 - iBOOKS
- Python для сложных задач: наука о данных и машинное обучение. - 978-5-4461-0914-2 - Плас Дж. Вандер - 2021 - Санкт-Петербург: Питер - https://ibooks.ru/bookshelf/376830 - 376830 - iBOOKS
- Линейная алгебра в примерах и задачах - Бортаковский А.С., Пантелеев А.В. - НИЦ ИНФРА-М - 2023 - https://znanium.com/catalog/product/1907364 - 1455020 - ZNANIUM
- Макаров, С. И., Высшая математика: математический анализ и линейная алгебра : учебное пособие / С. И. Макаров. — Москва : КноРус, 2023. — 320 с. — ISBN 978-5-406-11035-5. — URL: https://book.ru/book/947276 (дата обращения: 27.08.2024). — Текст : электронный.
- Мэрфи, К. П. Вероятностное машинное обучение. Введение / К. П. Мэрфи , перевод с английского А. А. Слинкина. — Москва : ДМК Пресс, 2022. — 940 с. — ISBN 978-5-93700-119-1. — Текст : электронный // Лань : электронно-библиотечная система. — URL: https://e.lanbook.com/book/314891 (дата обращения: 00.00.0000). — Режим доступа: для авториз. пользователей.
- Шагин, В. Л. Математический анализ. Базовые понятия : учебное пособие для вузов / В. Л. Шагин, А. В. Соколов. — Москва : Издательство Юрайт, 2023. — 245 с. — (Высшее образование). — ISBN 978-5-534-00884-5. — Текст : электронный // Образовательная платформа Юрайт [сайт]. — URL: https://urait.ru/bcode/512337 (дата обращения: 27.08.2024).
- Шень, А. Вероятность: примеры и задачи : учебное пособие / А. Шень. — 2-е изд., стер. — Москва : МЦНМО, 2008. — 64 с. — ISBN 978-5-94057-284-8. — Текст : электронный // Лань : электронно-библиотечная система. — URL: https://e.lanbook.com/book/9442 (дата обращения: 00.00.0000). — Режим доступа: для авториз. пользователей.