2023/2024
Анализ данных
Лучший по критерию «Полезность курса для Вашей будущей карьеры»
Лучший по критерию «Полезность курса для расширения кругозора и разностороннего развития»
Статус:
Маго-лего
Кто читает:
Департамент прикладной математики
Когда читается:
1, 2 модуль
Охват аудитории:
для своего кампуса
Преподаватели:
Кулаев Максим Александрович
Язык:
русский
Кредиты:
6
Контактные часы:
60
Программа дисциплины
Аннотация
Цель освоения дисциплины состоит в изучении базовых статистических методов анализа данных и их практическом применении. В рамках курса предполагается углубленное изучение как механизмов языка python (ООП, элементы функционального программирования, исключения, менеджеры контекстов, генераторы, итераторы и т.д.), так и пользовательских библиотек (numpy, pandas, matplotlib, seaborn, beautiful, soup, lxml, selenium, scipy).
Цель освоения дисциплины
- Цель курса — познакомить слушателей со сферой анализа данных, основными инструментами, задачами и методами, с которыми сталкивается исследователь данных в работе. В содержание курса включено знакомство с языком Python, разбор основных библиотек для анализа и визуализации данных Pandas, numpy, Matplotlib, прикладной статистический анализ данных, проверка статистических гипотез и работа с временными рядами. Для закрепления полученных теоретических знаний и ознакомления с современными методами анализа данных необходимо будет выполнить мини-проект по анализу данных.
Планируемые результаты обучения
- Способен получать, очищать, анализировать и визуализировать большие объёмы данных
- Способен реализовывать модели и алгоритмы прикладной математике в виде компьютерных программ
Содержание учебной дисциплины
- Введение в Python
- Библиотека NumpyД/З: написание типовых конструкций с использованием выражений-генераторов и функций.
- Библиотека PandasД/З: написать программу для скачивания информации о самых популярных 5000 книг из раздела "Художественная литература" магазина "Relod" с использованием библиотек BeautifulSoup и/или lxml.
- Визуализация данных
- Углубленный Python. Часть 1
- Углубленный Python. Часть 2
- Парсинг данных с помощью Python
- Введение в статистику - 1Д/З: Мини-проект по анализу данных
- Введение в статистику - 2
- Временные рядыД/З: Kaggle Inclass
- Введение в SQL
Список литературы
Рекомендуемая основная литература
- Provost, Foster, Fawcett, Tom. Data Science for Business: What you need to know about data mining and data-analytic thinking. – " O'Reilly Media, Inc.", 2013.
- Python и анализ данных, Маккинли, У., 2015
- Маккинни, У. Python и анализ данных / У. Маккинни , перевод с английского А. А. Слинкина. — 2-ое изд., испр. и доп. — Москва : ДМК Пресс, 2020. — 540 с. — ISBN 978-5-97060-590-5. — Текст : электронный // Лань : электронно-библиотечная система. — URL: https://e.lanbook.com/book/131721 (дата обращения: 00.00.0000). — Режим доступа: для авториз. пользователей.
Рекомендуемая дополнительная литература
- Мэтиз Э. - Изучаем Python. Программирование игр, визуализация данных, веб-приложения. 2-е изд. - 978-5-4461-0479-6 - Санкт-Петербург: Питер - 2017 - 355480 - https://ibooks.ru/bookshelf/355480/reading - iBOOKS