Бакалавриат
2024/2025
Анализ данных
Статус:
Курс обязательный (Филология)
Направление:
45.03.01. Филология
Кто читает:
Департамент филологии
Где читается:
Санкт-Петербургская школа гуманитарных наук и искусств
Когда читается:
3-й курс, 2 модуль
Формат изучения:
с онлайн-курсом
Онлайн-часы:
20
Охват аудитории:
для своего кампуса
Преподаватели:
Кирина Маргарита Александровна
Язык:
русский
Кредиты:
3
Контактные часы:
22
Программа дисциплины
Аннотация
Данный курс представляет собой адаптацию общеуниверситетского курса по анализу данных специально для студентов образовательной программы «Филология» и направлен на формирование компетенций в области статистики и анализа данных. В курсе будут рассмотрены темы, которые необходимы для успешного освоения основных понятий и методов, связанных с анализом данных. Дисциплина реализуется с помощью онлайн-курса «Учебник по Анализу данных (Начальный)»
Цель освоения дисциплины
- Целью освоения дисциплины «Анализ данных» является овладение студентами основами статистики и анализа данных для применения в решении различных практических задач.
Планируемые результаты обучения
- Понимать и корректно использовать основные статистические понятия
- Фильтровать данные по нескольким условиям
- Создавать сводные таблицы
- Вычислять коэффициент корреляции Пирсона и интерпретировать полученные результаты
- Использовать продвинутые методы визуализации данных, использовать различные диаграммы
- Переводить значения признака в z-оценки
Содержание учебной дисциплины
- Введение в инструменты
- Введение в статистику. Базовые манипуляции с данными
- Типы данных. Создание новых переменных
- Генеральная совокупность и выборка. Частотные таблицы и распределения
- Описательные статистики: меры центральной тенденции и разброса
- Z-оценка. Выбросы.
- Корреляция
- Введение в визуализацию данных
- Продвинутая визуализация данных
- Линейная регрессия
Элементы контроля
- Работа на семинарахВместе с заданием выдаются требования к результатам и сообщается максимальный балл за выполнение каждого из требований. Итоговая оценка за работу вычисляется как сумма набранных баллов или по правилам, прописанным в тексте работы, при их наличии. За задания могут выставляться частичные баллы в соответствие с долей выполненного задания, если критерии сформулированы в тексте задания. Совмещенный элемент контроля. Оценивается по 10-балльной шкале.
- Самостоятельные работы20-минутные тесты, проводимые на семинарах по пройденному материалу онлайн-курса. Каждый тест оценивается по 10-балльной шкале, в итоговую оценку идет среднее всех тестов. Множественное задание: состоит из 5 оцениваемых заданий. Синхронный элемент контроля.
- ЭкзаменКонтрольная, основанная на Спецификации НЭ по Анализу данных 2024-25 года начального уровня. Оценивается по 10-балльной шкале. Спецификация и демонстрационный вариант заданий опубликованы и доступны в курсе подготовки к НЭ по анализу данных (https://edu.hse.ru/course/view.php?id=136231) Подлежит обязательной пересдаче при ликвидации академической задолженности. Синхронный элемент контроля.
- Домашнее заданиеДомашнее задание представляет собой проведение разведочного анализа и составление дашборда на основе предложенного (или выбранного самостоятельно) набора данных. Вместе с заданием выдаются требования к результатам и сообщается максимальный балл за выполнение каждого из требований. Итоговая оценка за работу вычисляется как сумма набранных баллов или по правилам, прописанным в тексте работы, при их наличии. За задания могут выставляться частичные баллы в соответствие с долей выполненного задания, если критерии сформулированы в тексте задания. Асинхронный элемент контроля. Оценивается по 10-балльной шкале.
- Исследовательский проектВыполняется в группах из 3-4 человек и представляет собой самостоятельный анализ и интерпретацию полученных результатов на выбранных данных поэтапно. Возможно выполнение проекта по одному из тематических направдлений: 1) Анализ данных в Excel + продвинутая визуализация. 2) Использование NLP-инструментов (Python/R) для решения задачи компьютерного анализа текстов. 3) Использование Gephi / stylo для анализа корпусов текстов. Вместе с заданием выдаются требования к результатам и сообщается максимальный балл за выполнение каждого из требований. Итоговая оценка за работу вычисляется как сумма набранных баллов или по правилам, прописанным в тексте работы, при их наличии. За задания могут выставляться частичные баллы в соответствие с долей выполненного задания, если критерии сформулированы в тексте задания. Совмещенный элемент контроля. Оценивается по 10-балльной шкале.
Промежуточная аттестация
- 2024/2025 2nd module0.15 * Домашнее задание + 0.3 * Исследовательский проект + 0.2 * Работа на семинарах + 0.2 * Самостоятельные работы + 0.15 * Экзамен