Бакалавриат
2024/2025
Анализ данных на Python
Статус:
Курс обязательный (Дизайн)
Направление:
54.03.01. Дизайн
Где читается:
Факультет креативных индустрий
Когда читается:
3-й курс, 1, 2 модуль
Формат изучения:
с онлайн-курсом
Онлайн-часы:
50
Охват аудитории:
для своего кампуса
Язык:
русский
Кредиты:
3
Контактные часы:
20
Программа дисциплины
Аннотация
Данный курс направлен на формирование компетенций у студентов в области статистики и анализа данных. В курсе будут рассмотрены темы, которые необходимы для успешного освоения основных понятий и методов, связанных с анализом данных. Дисциплина реализуется с помощью онлайн-курса «Учебник по Анализу данных (Начальный)» в SmartLMS (https://edu.hse.ru/course/view.php?id=136231).
Цель освоения дисциплины
- Целью освоения дисциплины «Анализ данных» является овладение студентами основами статистики и анализа данных для применения в решении различных практических задач.
Планируемые результаты обучения
- Понимать и корректно использовать основные статистические понятия
- Фильтровать данные по нескольким условиям
- Создавать сводные таблицы
- Вычислять коэффициент корреляции Пирсона и интерпретировать полученные результаты
- Вычислять релевантные описательные статистики и интерпретировать полученные результаты
- Визуализировать данные с помощью простейших видов диаграмм: линейной, точечной, столбчатой
- Сортировать данные
- Переводить значения признака в z-оценки
- Обрабатывать пропущенные значения и выбросы
- Корректно открывать табличные данные различных форматов
- Использовать собственноручно написанные функции для обработки данных, создания новых переменных
- Использовать Python в применении к анализу данных
Содержание учебной дисциплины
- Введение в инструменты
- Введение в статистику. Базовые манипуляции с данными
- Типы данных. Создание новых переменных
- Генеральная совокупность и выборка. Частотные таблицы и распределения
- Описательные статистики: меры центральной тенденции и разброса
- Z-оценка. Выбросы
- Корреляция
- Введение в визуализацию данных
- Продвинутая визуализация данных
- Линейная регрессия
Элементы контроля
- Мини-тесты10-15 минутные тесты, проводимые в начале лекций по пройденному материалу онлайн-курса. Каждый тест оценивается по 10-балльной шкале, в итоговую оценку идет среднее всех тестов. Множественное задание: состоит из 3 -5 оцениваемых заданий. Синхронный элемент контроля.
- Контрольная работа - 1Проводится онлайн с демонстрацией экрана и прокторингом с двумя камерами. Контрольная, основанная на Спецификации НЭ по Анализу данных 2024-25 года начального уровня. В контрольную входит задания, аналогичные части заданий варианта НЭ, на решение которых отводится 60 минут. Оценивается по 10-балльной шкале. Спецификация и демонстрационный вариант заданий опубликованы и доступны в курсе подготовки к НЭ по Анализу данных. Подлежит обязательной пересдаче при ликвидации академической задолженности. Синхронный элемент контроля.
- Контрольная работа - 2Проводится онлайн с демонстрацией экрана и прокторингом с двумя камерами. Контрольная, основанная на Спецификации НЭ по Анализу данных 2024-25 года начального уровня. В контрольную входит задания, аналогичные части заданий варианта НЭ, на решение которых отводится 80 минут. Оценивается по 10-балльной шкале. Спецификация и демонстрационный вариант заданий опубликованы и доступны в курсе подготовки к НЭ по Анализу данных. Подлежит обязательной пересдаче при ликвидации академической задолженности. Синхронный элемент контроля.
- Домашнее заданиеВместе с заданием выдаются требования к результатам и сообщается максимальный балл за выполнение каждого из требований. Итоговая оценка за работу вычисляется как сумма набранных баллов или по правилам, прописанным в тексте работы, при их наличии. За задания могут выставляться частичные баллы в соответствие с долей выполненного задания, если критерии сформулированы в тексте задания. Домашнее задание: асинхронный элемент контроля. Оценивается по 10-балльной шкале.