Мы используем файлы cookies для улучшения работы сайта НИУ ВШЭ и большего удобства его использования. Более подробную информацию об использовании файлов cookies можно найти здесь, наши правила обработки персональных данных – здесь. Продолжая пользоваться сайтом, вы подтверждаете, что были проинформированы об использовании файлов cookies сайтом НИУ ВШЭ и согласны с нашими правилами обработки персональных данных. Вы можете отключить файлы cookies в настройках Вашего браузера.

  • A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта
Бакалавриат 2024/2025

Аналитика данных на Python

Направление: 38.03.01. Экономика
Когда читается: 3-й курс, 3 модуль
Формат изучения: без онлайн-курса
Охват аудитории: для своего кампуса
Преподаватели: Ефимов Константин Дмитриевич, Омеляш Ксения Васильевна, Юртаева Яна Николаевна
Язык: русский
Кредиты: 3

Программа дисциплины

Аннотация

Python – это интерпретируемый высокоуровневый язык программирования общего назначения. Этот язык удобно применять для сбора, обработки и визуализации данных. Этот одномодульный курс представляет собой расширение функционала языка программирования Python. Среднее время прохождения курса зависит от подготовки студента. Для прохождения курса студенты должны обладать математическими навыками на уровне средней школы. Успеваемость студентов оценивается с помощью заданий по программированию: классных работ и итогового проекта. Примеры и задачи, используемые в курсе, охватывают такие области, как парсинг сайтов и файлов, визуализация данных, машинное обучение на Python. Лекции по данному курсу не читаются, весь теоретический материал дается на семинарах.
Цель освоения дисциплины

Цель освоения дисциплины

  • ● использование Python для сбора данных с сайтов и из файлов ● умение строить информативные визуализации на Python ● знакомство с основами машинного обучения с использованием синтаксиса Python
Планируемые результаты обучения

Планируемые результаты обучения

  • студенты понимают детали применения парсинга для сбора данных с сайтов и умеют создавать код для его применения
  • студенты умеют применять библиотеки Python для использования дополнительного функционала
  • студенты способны применять базовые знания Python и совмещать их с новым материалом
Содержание учебной дисциплины

Содержание учебной дисциплины

  • 1. Способы хранения информации: Pandas, JSON, Pickle
  • 2. Парсинг по API, requests
  • 3. Скрэйпинг: re, bs4
  • 4. Парсинг файлов
  • 5. Описательные статистики; очистка данных; визуализация
  • 6. Линейная регрессия (statsmodels, scikit)
  • 7. Машинное обучение, деревья решений
Элементы контроля

Элементы контроля

  • неблокирующий Семинарские задания
  • неблокирующий Промежуточный и итоговый показ проекта
Промежуточная аттестация

Промежуточная аттестация

  • 2024/2025 3rd module
    0.6 * Промежуточный и итоговый показ проекта + 0.4 * Семинарские задания
Список литературы

Список литературы

Рекомендуемая основная литература

  • Паршинцева, Л. С., Многомерный анализ данных на Python : учебник / Л. С. Паршинцева, А. А. Паршинцев. — Москва : КноРус, 2024. — 129 с. — ISBN 978-5-406-12606-6. — URL: https://book.ru/book/951954 (дата обращения: 27.08.2024). — Текст : электронный.

Рекомендуемая дополнительная литература

  • Жуков, Р. А. Язык программирования Python. Практикум : учебное пособие / Р.А. Жуков. — Москва : ИНФРА-М, 2024. — 216 с. + Доп. материалы [Электронный ресурс]. — (Среднее профессиональное образование). - ISBN 978-5-16-015638-5. - Текст : электронный. - URL: https://znanium.ru/catalog/product/2131861

Авторы

  • Юртаева Яна Николаевна
  • Ефимов Константин Дмитриевич
  • Омеляш Ксения Васильевна
  • Бродская Наталья Николаевна