Бакалавриат
2023/2024
Продвинутые методы анализа и визуализации данных в Python
Лучший по критерию «Полезность курса для Вашей будущей карьеры»
Лучший по критерию «Полезность курса для расширения кругозора и разностороннего развития»
Статус:
Курс по выбору (Политология)
Направление:
41.03.04. Политология
Где читается:
Факультет социальных наук
Когда читается:
3-й курс, 3, 4 модуль
Формат изучения:
без онлайн-курса
Охват аудитории:
для всех кампусов НИУ ВШЭ
Преподаватели:
Бурова Маргарита Борисовна
Язык:
русский
Кредиты:
4
Контактные часы:
62
Программа дисциплины
Аннотация
Данный курс направлен на формирование компетенций у студентов в области статистики и анализа данных. В курсе будут рассмотрены темы, которые необходимы для успешного освоения основных понятий и методов, связанных с анализом данных. Дисциплина реализуется с помощью онлайн-курса «Учебник по Анализу данных (Начальный)» в SmartLMS (https://edu.hse.ru/course/view.php?id=136231).
Цель освоения дисциплины
- Целью освоения дисциплины «Анализ данных» является овладение студентами основами статистики и анализа данных для применения в решении различных практических задач.
Планируемые результаты обучения
- Понимать и корректно использовать основные статистические понятия
- Фильтровать данные по нескольким условиям
- Создавать сводные таблицы
- Вычислять коэффициент корреляции Пирсона и интерпретировать полученные результаты
- Вычислять релевантные описательные статистики и интерпретировать полученные результаты
- Визуализировать данные с помощью простейших видов диаграмм: линейной, точечной, столбчатой
- Сортировать данные
- Переводить значения признака в z-оценки
- Обрабатывать пропущенные значения и выбросы
- Корректно открывать табличные данные различных форматов
- Использовать собственноручно написанные функции для обработки данных, создания новых переменных
- Использовать Python в применении к анализу данных
Содержание учебной дисциплины
- Введение в инструменты
- Введение в статистику. Базовые манипуляции с данными
- Типы данных. Создание новых переменных
- Генеральная совокупность и выборка. Частотные таблицы и распределения
- Описательные статистики: меры центральной тенденции и разброса
- Z-оценка. Выбросы
- Корреляция
- Введение в визуализацию данных
- Продвинутая визуализация данных
- Линейная регрессия
- Основные понятия теории нейронных сетей.
- Классификация: KNN, Алгоритм решающих деревьев
- Введение в линейные модели и задача регрессии
- Кластеризация данных
- Рекомендательные системы
- Ансамбли
Элементы контроля
- Домашнее заданиеДомашнее задание: решение задачи машинного обучения
- Самостоятельные работы
- Работа на семинарах
- Контрольная работа
- Проект
Промежуточная аттестация
- 2023/2024 учебный год 4 модуль0.2 * Домашнее задание + 0.25 * Контрольная работа + 0.15 * Проект + 0.15 * Работа на семинарах + 0.25 * Самостоятельные работы