Бакалавриат
2024/2025




Аналитика данных на Python
Статус:
Курс обязательный (Международный бакалавриат по бизнесу и экономике)
Направление:
38.03.01. Экономика
Кто читает:
Департамент экономики
Где читается:
Санкт-Петербургская школа экономики и менеджмента
Когда читается:
3-й курс, 3 модуль
Формат изучения:
без онлайн-курса
Охват аудитории:
для своего кампуса
Язык:
русский
Кредиты:
3
Программа дисциплины
Аннотация
Python – это интерпретируемый высокоуровневый язык программирования общего назначения. Этот язык удобно применять для сбора, обработки и визуализации данных. Этот одномодульный курс представляет собой расширение функционала языка программирования Python. Среднее время прохождения курса зависит от подготовки студента. Для прохождения курса студенты должны обладать математическими навыками на уровне средней школы. Успеваемость студентов оценивается с помощью заданий по программированию: классных работ и итогового проекта. Примеры и задачи, используемые в курсе, охватывают такие области, как парсинг сайтов и файлов, визуализация данных, машинное обучение на Python. Лекции по данному курсу не читаются, весь теоретический материал дается на семинарах.
Цель освоения дисциплины
- ● использование Python для сбора данных с сайтов и из файлов ● умение строить информативные визуализации на Python ● знакомство с основами машинного обучения с использованием синтаксиса Python
Планируемые результаты обучения
- студенты понимают детали применения парсинга для сбора данных с сайтов и умеют создавать код для его применения
- студенты умеют применять библиотеки Python для использования дополнительного функционала
- студенты способны применять базовые знания Python и совмещать их с новым материалом
Содержание учебной дисциплины
- 1. Способы хранения информации: Pandas, JSON, Pickle
- 2. Парсинг по API, requests
- 3. Скрэйпинг: re, bs4
- 4. Парсинг файлов
- 5. Описательные статистики; очистка данных; визуализация
- 6. Линейная регрессия (statsmodels, scikit)
- 7. Машинное обучение, деревья решений
Промежуточная аттестация
- 2024/2025 3rd module0.6 * Промежуточный и итоговый показ проекта + 0.4 * Семинарские задания
Список литературы
Рекомендуемая основная литература
- Паршинцева, Л. С., Многомерный анализ данных на Python : учебник / Л. С. Паршинцева, А. А. Паршинцев. — Москва : КноРус, 2024. — 129 с. — ISBN 978-5-406-12606-6. — URL: https://book.ru/book/951954 (дата обращения: 27.08.2024). — Текст : электронный.
Рекомендуемая дополнительная литература
- Жуков, Р. А. Язык программирования Python. Практикум : учебное пособие / Р.А. Жуков. — Москва : ИНФРА-М, 2024. — 216 с. + Доп. материалы [Электронный ресурс]. — (Среднее профессиональное образование). - ISBN 978-5-16-015638-5. - Текст : электронный. - URL: https://znanium.ru/catalog/product/2131861