Бакалавриат
2021/2022
Технологии анализа больших данных
Статус:
Курс обязательный (Управление и аналитика в государственном секторе)
Направление:
38.03.04. Государственное и муниципальное управление
Кто читает:
Департамент государственного администрирования
Где читается:
Санкт-Петербургская школа социальных наук
Когда читается:
2-й курс, 1, 2 модуль
Формат изучения:
с онлайн-курсом
Онлайн-часы:
6
Охват аудитории:
для своего кампуса
Преподаватели:
Кольцов Сергей Николаевич
Язык:
русский
Кредиты:
6
Контактные часы:
44
Программа дисциплины
Аннотация
Настоящая дисциплина относится к профессиональному циклу дисциплин и блоку дисциплин, обеспечивающих базовую подготовку бакалавра для направления подготовки 38.03.04 «Государственное и муниципальное управление». Изучение данной дисциплины базируется на знаниях, полученных при изучении следующих дисциплин: • Математика • Количественные методы анализа данных Основные положения дисциплины должны быть использованы в дальнейшем при изучении следующих дисциплин: • Регулирование и анализ рынка труда • Экономическая и социальная статистика Изучение дисциплины проводится в ходе лекционных и семинарских занятий, а также самостоятельной работы с использованием онлайн-курса.
Цель освоения дисциплины
- Целями курса «Технологии анализа больших данных» является формирование у студентов: - системных представлений о технологиях обработки больших данных; - практических навыков обработки и анализа больших массивов информации.
Планируемые результаты обучения
- Применяет возможности модулей NamPy и matplotlib. Умеет с их помощью анализировать и визуализировать данные.
- Применяет основные объекты Pandas. Умеет группировать, индексировать и извлекать данные по заданным условиям
- Применяет основные понятия и основные алгоритмические конструкции Python. Умеет работать со списками, словарями, функциями.
- Применяет основы моделирования с помощью библиотек Python. Умеет строить модели регрессии и выполнять классификацию объектов.
- Умеет создавать web - запросы с помощью библиотеки requests
Содержание учебной дисциплины
- Тема 1. Введение в анализ больших данных
- Тема 2. Работа с библиотекой Pandas
- Тема 3 Анализ данных с NamPy и matplotlib
- Тема 4. Моделирование в Python
- Тема 5. Парсинг сайтов и обработка web - запросов.
Элементы контроля
- ЭкзаменЭкзамен проводится во 2-м модуле 2021 года
- ЭкзаменЭкзамен проведён в 3 модуле 2020 г.
- Тестовое задание 1 модуля
- Итоговый тест 1 модуля
- Тестовое задание 2 модуляВ течение 2 модуля проводится 2 (два) теста. В качестве оценки за тестовое задание 2 модуля принимается средняя оценка за два проведённых теста.
Промежуточная аттестация
- 2021/2022 учебный год 1 модуль0.6 * Итоговый тест 1 модуля + 0.4 * Тестовое задание 1 модуля
- 2021/2022 учебный год 2 модуль0.3 * 2021/2022 учебный год 1 модуль + 0.28 * Тестовое задание 2 модуля + 0.42 * Экзамен
Список литературы
Рекомендуемая основная литература
- Коэльо, Л. П. Построение систем машинного обучения на языке Python / Л. П. Коэльо, В. Ричарт ; перевод с английского А. А. Слинкин. — 2-е изд. — Москва : ДМК Пресс, 2016. — 302 с. — ISBN 978-5-97060-330-7. — Текст : электронный // Лань : электронно-библиотечная система. — URL: https://e.lanbook.com/book/82818 (дата обращения: 00.00.0000). — Режим доступа: для авториз. пользователей.
- Маккинни, У. Python и анализ данных / У. Маккинни ; перевод с английского А. А. Слинкина. — 2-ое изд., испр. и доп. — Москва : ДМК Пресс, 2020. — 540 с. — ISBN 978-5-97060-590-5. — Текст : электронный // Лань : электронно-библиотечная система. — URL: https://e.lanbook.com/book/131721 (дата обращения: 00.00.0000). — Режим доступа: для авториз. пользователей.
Рекомендуемая дополнительная литература
- Embarak O. Data Analysis and Visualization Using Python: Analyze Data to Create Visualizations for BI Systems. - Apress, 2018.