Бакалавриат
2023/2024
Анализ данных в Python
Статус:
Курс обязательный (Юриспруденция: частное право)
Направление:
40.03.01. Юриспруденция
Где читается:
Факультет права
Когда читается:
3-й курс, 3 модуль
Формат изучения:
с онлайн-курсом
Онлайн-часы:
50
Охват аудитории:
для своего кампуса
Преподаватели:
Карпов Максим Евгеньевич
Язык:
русский
Кредиты:
3
Контактные часы:
6
Программа дисциплины
Аннотация
Данный курс направлен на формирование компетенций у студентов в области статистики и анализа данных. В курсе будут рассмотрены темы, которые необходимы для успешного освоения основных понятий и методов, связанных с анализом данных. Дисциплина реализуется с помощью онлайн-курса «Учебник по Анализу данных (Начальный)» в SmartLMS (https://edu.hse.ru/course/view.php?id=136231).
Цель освоения дисциплины
- Целью освоения дисциплины «Анализ данных» является овладение студентами основами статистики и анализа данных для применения в решении различных практических задач.
Планируемые результаты обучения
- Понимать и корректно использовать основные статистические понятия
- Фильтровать данные по нескольким условиям
- Создавать сводные таблицы
- Вычислять коэффициент корреляции Пирсона и интерпретировать полученные результаты
- Вычислять релевантные описательные статистики и интерпретировать полученные результаты
- Визуализировать данные с помощью простейших видов диаграмм: линейной, точечной, столбчатой
- Сортировать данные
- Переводить значения признака в z-оценки
- Обрабатывать пропущенные значения и выбросы
- Корректно открывать табличные данные различных форматов
- Использовать собственноручно написанные функции для обработки данных, создания новых переменных
- Использовать Python в применении к анализу данных
Содержание учебной дисциплины
- Введение в инструменты
- Введение в статистику. Базовые манипуляции с данными
- Типы данных. Создание новых переменных
- Генеральная совокупность и выборка. Частотные таблицы и распределения
- Описательные статистики: меры центральной тенденции и разброса
- Z-оценка. Выбросы
- Корреляция
- Введение в визуализацию данных
- Продвинутая визуализация данных
- Линейная регрессия
- Введение в машинное обучение и анализ данных
- Введение в линейные модели и задача регрессии
- Задача классификации текстовых данных
- Задачи кластеризации
- Основные понятия теории нейронных сетей.
- Рекомендательные системы
Элементы контроля
- Тесты (Онлайн курс)
- Самостоятельные работы
- Проект
- ЭкзаменЭкзамен проходит дистанционно онлайн с прокторингом, используя две камеры (одна с компьютера, вторая со смартфона).
Промежуточная аттестация
- 2023/2024 3rd modulemin(0.05 * Тесты (Онлайн курс) + 0.2 * Самостоятельные работы + 0.25 * Проект + 0.5 * Экзамен, 8). В соответствии с п. 69 “Положения об организации промежуточной аттестации и текущего контроля успеваемости студентов” (ПОПАТКУС) итоговая оценка студента за дисциплину-пререквизит (ДПР) к НЭ по АД не может быть больше 8 баллов.