• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта
Бакалавриат 2024/2025

Анализ данных

Статус: Курс обязательный (Филология)
Направление: 45.03.01. Филология
Когда читается: 3-й курс, 2 модуль
Формат изучения: с онлайн-курсом
Онлайн-часы: 20
Охват аудитории: для своего кампуса
Язык: русский
Кредиты: 3
Контактные часы: 22

Программа дисциплины

Аннотация

Данный курс представляет собой адаптацию общеуниверситетского курса по анализу данных специально для студентов образовательной программы «Филология» и направлен на формирование компетенций в области статистики и анализа данных. В курсе будут рассмотрены темы, которые необходимы для успешного освоения основных понятий и методов, связанных с анализом данных. Дисциплина реализуется с помощью онлайн-курса «Учебник по Анализу данных (Начальный)»
Цель освоения дисциплины

Цель освоения дисциплины

  • Целью освоения дисциплины «Анализ данных» является овладение студентами основами статистики и анализа данных для применения в решении различных практических задач.
Планируемые результаты обучения

Планируемые результаты обучения

  • Понимать и корректно использовать основные статистические понятия
  • Фильтровать данные по нескольким условиям
  • Создавать сводные таблицы
  • Вычислять коэффициент корреляции Пирсона и интерпретировать полученные результаты
  • Использовать продвинутые методы визуализации данных, использовать различные диаграммы
  • Переводить значения признака в z-оценки
Содержание учебной дисциплины

Содержание учебной дисциплины

  • Введение в инструменты
  • Введение в статистику. Базовые манипуляции с данными
  • Типы данных. Создание новых переменных
  • Генеральная совокупность и выборка. Частотные таблицы и распределения
  • Описательные статистики: меры центральной тенденции и разброса
  • Z-оценка. Выбросы.
  • Корреляция
  • Введение в визуализацию данных
  • Продвинутая визуализация данных
  • Линейная регрессия
Элементы контроля

Элементы контроля

  • неблокирующий Работа на семинарах
    Вместе с заданием выдаются требования к результатам и сообщается максимальный балл за выполнение каждого из требований. Итоговая оценка за работу вычисляется как сумма набранных баллов или по правилам, прописанным в тексте работы, при их наличии. За задания могут выставляться частичные баллы в соответствие с долей выполненного задания, если критерии сформулированы в тексте задания. Совмещенный элемент контроля. Оценивается по 10-балльной шкале.
  • неблокирующий Самостоятельные работы
    20-минутные тесты, проводимые на семинарах по пройденному материалу онлайн-курса. Каждый тест оценивается по 10-балльной шкале, в итоговую оценку идет среднее всех тестов. Множественное задание: состоит из 5 оцениваемых заданий. Синхронный элемент контроля.
  • неблокирующий Экзамен
    Контрольная, основанная на Спецификации НЭ по Анализу данных 2024-25 года начального уровня. Оценивается по 10-балльной шкале. Спецификация и демонстрационный вариант заданий опубликованы и доступны в курсе подготовки к НЭ по анализу данных (https://edu.hse.ru/course/view.php?id=136231) Подлежит обязательной пересдаче при ликвидации академической задолженности. Синхронный элемент контроля.
  • неблокирующий Домашнее задание
    Домашнее задание представляет собой проведение разведочного анализа и составление дашборда на основе предложенного (или выбранного самостоятельно) набора данных. Вместе с заданием выдаются требования к результатам и сообщается максимальный балл за выполнение каждого из требований. Итоговая оценка за работу вычисляется как сумма набранных баллов или по правилам, прописанным в тексте работы, при их наличии. За задания могут выставляться частичные баллы в соответствие с долей выполненного задания, если критерии сформулированы в тексте задания. Асинхронный элемент контроля. Оценивается по 10-балльной шкале.
  • неблокирующий Исследовательский проект
    Выполняется в группах из 3-4 человек и представляет собой самостоятельный анализ и интерпретацию полученных результатов на выбранных данных поэтапно. Возможно выполнение проекта по одному из тематических направдлений: 1) Анализ данных в Excel + продвинутая визуализация. 2) Использование NLP-инструментов (Python/R) для решения задачи компьютерного анализа текстов. 3) Использование Gephi / stylo для анализа корпусов текстов. Вместе с заданием выдаются требования к результатам и сообщается максимальный балл за выполнение каждого из требований. Итоговая оценка за работу вычисляется как сумма набранных баллов или по правилам, прописанным в тексте работы, при их наличии. За задания могут выставляться частичные баллы в соответствие с долей выполненного задания, если критерии сформулированы в тексте задания. Совмещенный элемент контроля. Оценивается по 10-балльной шкале.
Промежуточная аттестация

Промежуточная аттестация

  • 2024/2025 2nd module
    0.15 * Домашнее задание + 0.3 * Исследовательский проект + 0.2 * Работа на семинарах + 0.2 * Самостоятельные работы + 0.15 * Экзамен
Список литературы

Список литературы

Рекомендуемая основная литература

  • Essentials of statistics for the behavioral sciences, Gravetter, F. J., 2014

Авторы

  • Кирина Маргарита Александровна