• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта
Магистратура 2023/2024

Основы Python для анализа данных

Лучший по критерию «Полезность курса для расширения кругозора и разностороннего развития»
Лучший по критерию «Новизна полученных знаний»
Статус: Курс по выбору (Статистический анализ в экономике)
Направление: 38.04.01. Экономика
Когда читается: 1-й курс, 3, 4 модуль
Формат изучения: без онлайн-курса
Охват аудитории: для всех кампусов НИУ ВШЭ
Прогр. обучения: Статистический анализ в экономике
Язык: русский
Кредиты: 6
Контактные часы: 60

Программа дисциплины

Аннотация

Курс направлен на подготовку студентов, ранее не занимавшихся программированием, к проведению базового эксплоративного анализа данных, их визуализации, чтения и записи. Первый модуль включает в себя изучение основ языка Python, а во втором модуле будут рассмотрены ключевые библиотеки из стека любого дата-аналитика: numpy, scipy, pandas, matplotlib и т.д. По результатам курса студенты будут подготовлены к решению базовых задач в сфере обработки данных на Python, а также к прохождению более сложных курсов по анализу данных и машинному обучению
Цель освоения дисциплины

Цель освоения дисциплины

  • Освоить синтаксис и основные конструкций языка программирования Python, необходимых для анализа данных
  • Получить навыки написания кода на Python, а также навыки анализа и визуализации больших массивов информации с помощью библиотек Python
  • Понимать сферы применения языка Python и уметь анализировать сторонний код на Python
Планируемые результаты обучения

Планируемые результаты обучения

  • Знать особенности работы с современными дистрибутивами Python
  • - Освоить базовый синтаксис языка программирования Python
  • Обработка и анализ больших массивов данных, умение проводить исследовательский анализ данных (EDA).
Содержание учебной дисциплины

Содержание учебной дисциплины

  • Введение в Python, переменные и базовые типы данных
  • Типы данных (контейнеры) в Python
  • Условия и циклы в Python
  • Функции и модули в Python
  • Групповой проект по основам Python
  • Библиотеки для анализа данных: Pandas
  • Библиотеки для анализа данных: Numpy
  • Визуализация данных в Python
  • Исследовательский анализ данных в Python
  • Групповой проект по анализу данных
Элементы контроля

Элементы контроля

  • неблокирующий Активность на семинарах
    Активность на семинарах (решение заданий, ответы на вопросы преподавателя)
  • неблокирующий Выступление с презентацией (в командах)
    Короткое (10-15 минут) выступление на тему из перечня
  • неблокирующий Подготовка и защита проекта (в командах)
    Самостоятельное написание кода, исследование данных, постановка гипотез, проверки гипотез, проведение анализа данных, визуализация данных
  • неблокирующий Итоговый анализ данных
    Самостоятельное исследование предложенных данных и ответы на вопросы по датасету
  • неблокирующий Итоговый тест по темам курса
    Итоговый тест по темам курса
Промежуточная аттестация

Промежуточная аттестация

  • 2023/2024 4th module
    0.1 * Активность на семинарах + 0.1 * Активность на семинарах + 0.1 * Выступление с презентацией (в командах) + 0.1 * Выступление с презентацией (в командах) + 0.2 * Итоговый анализ данных + 0.1 * Итоговый тест по темам курса + 0.15 * Подготовка и защита проекта (в командах) + 0.15 * Подготовка и защита проекта (в командах)
Список литературы

Список литературы

Рекомендуемая основная литература

  • Pandas for everyone : Python data analysis, Chen, D. Y., 2023
  • Python для data science, Васильев, Ю., 2023
  • Python для data science. - 978-5-4461-2392-6 - Васильев Юлий - 2023 - Санкт-Петербург: Питер - https://ibooks.ru/bookshelf/390133 - 390133 - iBOOKS
  • Изучаем pandas : высокопроизводительная обработка и анализ данных в Python, Хейдт, М., 2018
  • Маккинни, У. Python и анализ данных. Первичная обработка данных с применением pandas, NumPy и Jupiter : справочник / У. Маккинни , перевод с английского А. А. Слинкина. — 3-е изд. — Москва : ДМК Пресс, 2023. — 536 с. — ISBN 978-5-93700-174-0. — Текст : электронный // Лань : электронно-библиотечная система. — URL: https://e.lanbook.com/book/348086 (дата обращения: 00.00.0000). — Режим доступа: для авториз. пользователей.
  • Простой Python. Современный стиль программирования, Любанович, Б., 2023
  • Титов, А. Н. Обработка данных в Python. Основы работы с библиотекой Pandas : учебно-методическое пособие / А. Н. Титов, Р. Ф. Тазиева. — Казань : КНИТУ, 2022. — 116 с. — ISBN 978-5-7882-3164-8. — Текст : электронный // Лань : электронно-библиотечная система. — URL: https://e.lanbook.com/book/331013 (дата обращения: 00.00.0000). — Режим доступа: для авториз. пользователей.

Рекомендуемая дополнительная литература

  • Изучаем Python : программирование игр, визуализация данных, веб - приложения, Мэтиз, Э., 2017
  • Язык программирования Python. Практикум - Жуков Р.А. - НИЦ ИНФРА-М - 2023 - https://znanium.com/catalog/product/1916202 - 1081520 - ZNANIUM

Авторы

  • Рычкова Элла Николаевна
  • Искяндяров Руслан Рушанович