• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта
Бакалавриат 2024/2025

Научно-исследовательский семинар "Основы анализа данных"

Статус: Курс обязательный (Политология)
Направление: 41.03.04. Политология
Когда читается: 3-й курс, 3 модуль
Формат изучения: без онлайн-курса
Охват аудитории: для своего кампуса
Язык: русский
Кредиты: 1

Программа дисциплины

Аннотация

Lисциплина нацелена на развитие навыков обработки количественных данных в Python без углубления в математические основы и статистическую теорию. Элементы статистической теории в этом курсе используются, однако акцент делается на процедурах подготовки данных к анализу (чистка данных, фильтрация, группировка, агрегирование, элементы визуализации), а также использовании и интерпретации коэффициентов корреляции и регрессии (линейной и логистической) - наиболее широко применяемых инструментах анализа данных в социальных науках.
Цель освоения дисциплины

Цель освоения дисциплины

  • освоение инструментов анализа данных в Python, подготовка к независимому экзамену по анализу данных
Планируемые результаты обучения

Планируемые результаты обучения

  • различать корреляцию и каузацию по предложенным описаниям исследований
  • уметь вычислять в Python коэффициент корреляции Пирсона и проверять его статистическую значимость
  • уметь реализовывать в Python проверку независимости признаков в качественной шкале с помощью критерия хи-квадрат Пирсона
  • различать по описанию исследования тип задачи машинного обучения
  • уметь реализовывать в Python метод k-ближайших соседей
  • уметь оценивать в Python модель линейной регрессии и интерпретировать полученные результаты
  • уметь оценивать в Python модель логистической регрессии и интерпретировать полученные результаты
Содержание учебной дисциплины

Содержание учебной дисциплины

  • Меры связи
  • Введение в машинное обучение
  • Примеры прогнозирования в машинном обучении: линейная регрессия
  • Примеры классификации в машинном обучении: логистическая регрессия
Элементы контроля

Элементы контроля

  • неблокирующий Homework
    Набор теоретических и практических заданий в формате независимого экзамена по анализу данных. Практическая часть выполняется в Python. В процессе выполнения практической части запрещено использовать инструменты искусственного интеллекта (включая ChatGPT и его аналоги).
  • неблокирующий Практикум
    Набор практических заданий в Python в формате задач части B и C независимого экзамена по анализу данных.
  • неблокирующий Test
    Письменная работа на 10 минут, включающая закрытые и открытые вопросы по пройденным темам.
  • неблокирующий Экзамен
    Набор заданий в формате независимого экзамена по анализу данных.
Промежуточная аттестация

Промежуточная аттестация

  • 2024/2025 3rd module
    0.2 * Homework + 0.15 * Test + 0.2 * Практикум + 0.45 * Экзамен
Список литературы

Список литературы

Рекомендуемая основная литература

  • Python и анализ данных : первичная обработка данных с применением pandas, NumPy и Jupiter, Маккинни, У., 2023
  • Введение в статистическое обучение с примерами на языке R, Джеймс, Г., 2016

Рекомендуемая дополнительная литература

  • Taieb, D. (2018). Data Analysis with Python : A Modern Approach. Birmingham, UK: Packt Publishing. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=1993344

Авторы

  • Буваева Роксана Викторовна
  • Тамбовцева Алла Андреевна