2023/2024
Основы Python для анализа данных
Лучший по критерию «Полезность курса для Вашей будущей карьеры»
Лучший по критерию «Полезность курса для расширения кругозора и разностороннего развития»
Статус:
Маго-лего
Кто читает:
Департамент статистики и анализа данных
Когда читается:
3, 4 модуль
Охват аудитории:
для всех кампусов НИУ ВШЭ
Преподаватели:
Искяндяров Руслан Рушанович
Язык:
русский
Кредиты:
6
Контактные часы:
60
Программа дисциплины
Аннотация
Курс направлен на подготовку студентов, ранее не занимавшихся программированием, к проведению базового эксплоративного анализа данных, их визуализации, чтения и записи. Первый модуль включает в себя изучение основ языка Python, а во втором модуле будут рассмотрены ключевые библиотеки из стека любого дата-аналитика: numpy, scipy, pandas, matplotlib и т.д. По результатам курса студенты будут подготовлены к решению базовых задач в сфере обработки данных на Python, а также к прохождению более сложных курсов по анализу данных и машинному обучению
Цель освоения дисциплины
- Освоить синтаксис и основные конструкций языка программирования Python, необходимых для анализа данных
- Получить навыки написания кода на Python, а также навыки анализа и визуализации больших массивов информации с помощью библиотек Python
- Понимать сферы применения языка Python и уметь анализировать сторонний код на Python
Планируемые результаты обучения
- Знать особенности работы с современными дистрибутивами Python
- - Освоить базовый синтаксис языка программирования Python
- Обработка и анализ больших массивов данных, умение проводить исследовательский анализ данных (EDA).
Содержание учебной дисциплины
- Введение в Python, переменные и базовые типы данных
- Типы данных (контейнеры) в Python
- Условия и циклы в Python
- Функции и модули в Python
- Групповой проект по основам Python
- Библиотеки для анализа данных: Pandas
- Библиотеки для анализа данных: Numpy
- Визуализация данных в Python
- Исследовательский анализ данных в Python
- Групповой проект по анализу данных
Элементы контроля
- Активность на семинарахАктивность на семинарах (решение заданий, ответы на вопросы преподавателя)
- Выступление с презентацией (в командах)Короткое (10-15 минут) выступление на тему из перечня
- Подготовка и защита проекта (в командах)Самостоятельное написание кода, исследование данных, постановка гипотез, проверки гипотез, проведение анализа данных, визуализация данных
- Итоговый анализ данныхСамостоятельное исследование предложенных данных и ответы на вопросы по датасету
- Итоговый тест по темам курсаИтоговый тест по темам курса
Промежуточная аттестация
- 2023/2024 4th module0.1 * Активность на семинарах + 0.1 * Активность на семинарах + 0.1 * Выступление с презентацией (в командах) + 0.1 * Выступление с презентацией (в командах) + 0.2 * Итоговый анализ данных + 0.1 * Итоговый тест по темам курса + 0.15 * Подготовка и защита проекта (в командах) + 0.15 * Подготовка и защита проекта (в командах)
Список литературы
Рекомендуемая основная литература
- Pandas for everyone : Python data analysis, Chen, D. Y., 2023
- Python для data science, Васильев, Ю., 2023
- Python для data science. - 978-5-4461-2392-6 - Васильев Юлий - 2023 - Санкт-Петербург: Питер - https://ibooks.ru/bookshelf/390133 - 390133 - iBOOKS
- Изучаем pandas : высокопроизводительная обработка и анализ данных в Python, Хейдт, М., 2018
- Маккинни, У. Python и анализ данных. Первичная обработка данных с применением pandas, NumPy и Jupiter : справочник / У. Маккинни , перевод с английского А. А. Слинкина. — 3-е изд. — Москва : ДМК Пресс, 2023. — 536 с. — ISBN 978-5-93700-174-0. — Текст : электронный // Лань : электронно-библиотечная система. — URL: https://e.lanbook.com/book/348086 (дата обращения: 00.00.0000). — Режим доступа: для авториз. пользователей.
- Простой Python. Современный стиль программирования, Любанович, Б., 2023
- Титов, А. Н. Обработка данных в Python. Основы работы с библиотекой Pandas : учебно-методическое пособие / А. Н. Титов, Р. Ф. Тазиева. — Казань : КНИТУ, 2022. — 116 с. — ISBN 978-5-7882-3164-8. — Текст : электронный // Лань : электронно-библиотечная система. — URL: https://e.lanbook.com/book/331013 (дата обращения: 00.00.0000). — Режим доступа: для авториз. пользователей.
Рекомендуемая дополнительная литература
- Изучаем Python : программирование игр, визуализация данных, веб - приложения, Мэтиз, Э., 2017
- Язык программирования Python. Практикум - Жуков Р.А. - НИЦ ИНФРА-М - 2023 - https://znanium.com/catalog/product/1916202 - 1081520 - ZNANIUM