Бакалавриат
2024/2025
Анализ данных в Python
Статус:
Курс обязательный (Цифровой маркетинг)
Направление:
38.03.02. Менеджмент
Где читается:
Факультет менеджмента (Нижний Новгород)
Когда читается:
3-й курс, 1, 2 модуль
Формат изучения:
с онлайн-курсом
Онлайн-часы:
20
Охват аудитории:
для своего кампуса
Преподаватели:
Привалов Игорь Васильевич
Язык:
русский
Кредиты:
3
Программа дисциплины
Аннотация
Курс по анализу данных на Python представляет собой обширное обучение, нацеленное на развитие навыков работы с данными и аналитическими методами с помощью языка программирования Python. Курс включает в себя теоретические аспекты анализа данных, практические занятия и реальные проекты, которые помогут студентам приобрести необходимые навыки для решения задач анализа данных в различных областях.В ходе курса студенты изучают основы работы с данными, такие как обработка и преобразование данных, визуализация данных, статистический анализ и машинное обучение. Они также ознакомятся с различными библиотеками Python, такими как Pandas, NumPy, Matplotlib и Scikit-learn, которые являются основными инструментами для анализа данных на этом языке программирования.
Цель освоения дисциплины
- Научить студентов основным навыкам программирования на языке Python. Научить студентов основным методам извлечения и обработки данных, необходимым для дальнейшего обучения и работы по специальности. Познакомить студентов с основными концепциями и методами анализа данных, статистики и машинного обучения.
Планируемые результаты обучения
- Знает, чем наука о данных отличается от машинного обучения и статистики
- Владеть: навыками применения библиотеки Pandas при решении практических задач.
- Знать особенности работы с современными дистрибутивами Python
- Понимать принципы визуализация данных и построения эффективных панелей индикаторов
- Владеет базовыми навыками работы с данными: агрегированием, фильтрацией, созданием новых переменных, работой со сводными таблицами.
- Владеет процедурой обнаружения пропущенных значений. Умеет работать с пропущенными значениями: удаление и стратегии замены.
- Знает типы переменных. Знает меры центральной тенденции и разброса. Знает процедуру обнаружения выбросов. Умеет обрабатывать выбросы.
- Уметь применять машинное обучение для решения задач анализа данных
- Студент понимает роль Data Science в стратегическом развитии бизнеса.
Содержание учебной дисциплины
- Интро
- Инструменты для работы с данными в Python
- Типы переменных
- Работа с данными
- Визуализация
- Машинное обучение
Элементы контроля
- Практическое заданиеСоздание аналитического отчета по датасету и ответ на вопросы Критерии оценивания: Точность кода, оформление, полноту выполненных заданий, адекватность визуализаций и глубину аналитики. Важно, каждый ваш шаг снабжать текстом, чтобы не было голого кода, объясняйте что вы делаете и если вы получили что-то, что нужно анализировать, то дайте мне этот анализ в виде текста.
- ТЕСТТест из курса по подготовке к экзамену
Список литературы
Рекомендуемая основная литература
- Data Science : наука о данных с нуля, Грас, Дж., 2018
- Data Science. Наука о данных с нуля: Пер. с англ. — 2-е изд., перераб. и доп. - 978-5-9775-6731-2 - Грас Д. - 2021 - Санкт-Петербург: БХВ-Петербург - https://ibooks.ru/bookshelf/356414 - 356414 - iBOOKS
- Маккинни, У. Python и анализ данных. Первичная обработка данных с применением pandas, NumPy и Jupiter : справочник / У. Маккинни , перевод с английского А. А. Слинкина. — 3-е изд. — Москва : ДМК Пресс, 2023. — 536 с. — ISBN 978-5-93700-174-0. — Текст : электронный // Лань : электронно-библиотечная система. — URL: https://e.lanbook.com/book/348086 (дата обращения: 00.00.0000). — Режим доступа: для авториз. пользователей.
Рекомендуемая дополнительная литература
- Теоретический минимум по Big Data : все, что нужно знать о больших данных, Ын, А., 2019