Бакалавриат
2024/2025
Технологии анализа больших данных
Статус:
Курс обязательный (Управление и аналитика в государственном секторе)
Направление:
38.03.04. Государственное и муниципальное управление
Кто читает:
Департамент государственного администрирования
Где читается:
Санкт-Петербургская школа социальных наук
Когда читается:
2-й курс, 2 модуль
Формат изучения:
с онлайн-курсом
Онлайн-часы:
20
Охват аудитории:
для своего кампуса
Преподаватели:
Силаева Светлана Анатольевна
Язык:
русский
Кредиты:
6
Программа дисциплины
Аннотация
Настоящая дисциплина относится к профессиональному циклу дисциплин и блоку дисциплин, обеспечивающих базовую подготовку бакалавра для направления подготовки 38.03.04 «Государственное и муниципальное управление». Изучение данной дисциплины базируется на знаниях, полученных при изучении следующих дисциплин: • Математика • Количественные методы анализа данных Основные положения дисциплины должны быть использованы в дальнейшем при изучении следующих дисциплин: • Регулирование и анализ рынка труда • Экономическая и социальная статистика Изучение дисциплины проводится в ходе лекционных и семинарских занятий, а также самостоятельной работы с использованием онлайн-курса.
Цель освоения дисциплины
- Целями курса «Технологии анализа больших данных» является формирование у студентов: - системных представлений о технологиях обработки больших данных; - практических навыков обработки и анализа больших массивов информации.
Планируемые результаты обучения
- Применяет возможности модулей NamPy и matplotlib. Умеет с их помощью анализировать и визуализировать данные.
- Применяет основные объекты Pandas. Умеет группировать, индексировать и извлекать данные по заданным условиям
- Применяет основные понятия и основные алгоритмические конструкции Python. Умеет работать со списками, словарями, функциями.
- Применяет основы моделирования с помощью библиотек Python. Умеет строить модели регрессии и выполнять классификацию объектов.
- Умеет создавать web - запросы с помощью библиотеки requests
Содержание учебной дисциплины
- Тема 1. Введение в анализ больших данных
- Тема 2. Работа с библиотекой Pandas
- Тема 3 Анализ данных с NamPy и matplotlib
- Тема 4. Моделирование в Python
- Тема 5. Парсинг сайтов и обработка web - запросов.
Элементы контроля
- Тесты на лекцияхТестовый опрос на лекциях по пройденному теоретическому материалу
- Домашняя (самостоятельная) работа
- Контрольная работаКонтрольная работа включает тесты и написние кода по вариантам заданий.
- Итоговый проект
Список литературы
Рекомендуемая основная литература
- Коэльо, Л. П. Построение систем машинного обучения на языке Python / Л. П. Коэльо, В. Ричарт , перевод с английского А. А. Слинкин. — 2-е изд. — Москва : ДМК Пресс, 2016. — 302 с. — ISBN 978-5-97060-330-7. — Текст : электронный // Лань : электронно-библиотечная система. — URL: https://e.lanbook.com/book/82818 (дата обращения: 00.00.0000). — Режим доступа: для авториз. пользователей.
- Маккинни, У. Python и анализ данных / У. Маккинни , перевод с английского А. А. Слинкина. — 2-ое изд., испр. и доп. — Москва : ДМК Пресс, 2020. — 540 с. — ISBN 978-5-97060-590-5. — Текст : электронный // Лань : электронно-библиотечная система. — URL: https://e.lanbook.com/book/131721 (дата обращения: 00.00.0000). — Режим доступа: для авториз. пользователей.
Рекомендуемая дополнительная литература
- Embarak O. Data Analysis and Visualization Using Python: Analyze Data to Create Visualizations for BI Systems. - Apress, 2018.