Бакалавриат
2020/2021
Основы анализа данных в международных отношениях
Статус:
Курс обязательный (Международные отношения)
Направление:
41.03.05. Международные отношения
Где читается:
Факультет мировой экономики и мировой политики
Когда читается:
2-й курс, 1, 2 модуль
Формат изучения:
с онлайн-курсом
Преподаватели:
Бурданова Софья Павловна,
Бурова Маргарита Борисовна,
Волкова Анастасия Эдуардовна,
Поляков Александр Сергеевич,
Садыкова Дарья Константиновна
Язык:
русский
Кредиты:
3
Контактные часы:
48
Программа дисциплины
Аннотация
Данная дисциплина знакомит студентов ОП Международные отношения с основами анализа данных и с языком программирования Python. В ходе ее изучения студенты учатся ставить профессиональные задачи и решать их посредством методов статистического анализа и машинного обучения. Кроме того, часть курса посвящена визуализации данных и сетевому анализу. С использованием онлайн-курса "Python для извлечения и обработки данных" (URL: https://openedu.ru/course/hse/PYTHON/).
Цель освоения дисциплины
- Получение студентом целостного представления о возможностях и ограничениях современных статистических методов и машинного обучения, а также об особенностях анализа данных в международных отношениях.
Планируемые результаты обучения
- Вычисляет любые описательные статистики самостоятельно и с помощью python
- Вычисляет коэффициент корреляции
- Может проинтерпретировать результаты корреляционного анализа
- Умеет решать задачу регрессии
- Может подобрать необходимый тип визуализации для предложенных данных и реализовать его
- Может нарисовать граф по данным и проинтерпретировать все основные метрики
- Умеет решать задачи из профессиональной области с применением анализа данных
- Умеет формулировать гипотезы, проверять их, интерпретировать полученный результат
- Знает основные понятия, связанные с машинным обучением
- Умеет решать задачу классификации
Содержание учебной дисциплины
- Введение в анализ данных в международных отношениях. Основные инструменты. Python.Введение в анализ данных в международных отношениях. Примеры кейсов из предметной области. Наиболее востребованные количественные методы анализа международных отношений: математическая статистика, сетевой анализ, системный анализ. Поиск данных, примеры источников экономических и политических данных. Семинары Знакомство с языком программирования Python. Особенности синтаксиса. Ввод и вывод данных, создание новых переменных. Типы данных. Условия: if, elif, else. Математические вычисления: сложение, вычитание, умножение, деление, целочисленное деление, остаток от деления, возведение в степень. Цикл for. Работа со строчными данными. Списки. Множества. Словари. Создание функций, рекурсия. Библиотеки pandas, numpy, matplotlib.
- Описательные статистики.Начала статистики. Описательные статистики: среднее, мода, медиана. Меры разброса данных. Типы переменных: количественные, порядковые, категориальные. Применимость мер для различных типов переменных. Примеры расчета описательных статистик для кейсов из области международных отношений: первичный анализ данных по международным конфликтам, ядерному распределению, международным финансовым организациям. Семинары Расчет описательных статистик с помощью функций python. Примеры расчета на открытых базах данных, содержащих информацию о международных конфликтах.
- Проверка статистических гипотезЛекции Проверка статистических гипотез. Уровень значимости. Ошибки 1-ого и 2-ого рода. Сравнение средних, критерий Стьюдента. Примеры кейсов из предметной области. Семинары Сравнение средних, реализация пройденного с помощью python. Расчет p-value.
- Корреляционный анализЛекции Коэффициент линейной корреляции Пирсона (для переменных, измеренных на уровне шкал высокого порядка), коэффициенты ранговой корреляции Спирмена. Интерпретация результатов корреляционного анализа. Анализ зависимостей между явлениями или действиями игроков на международной арене с помощью корреляционного анализа. Семинары Исследование взаимосвязи на примере реальных данных. Расчет коэффициентов корреляций для различных типов данных при помощи библиотек и функций Python
- Машинное обучениеЦели применения регрессионных моделей. Линейный регрессионный анализ. Зависимые и независимые признаки. Интерпретация коэффициентов регрессии. МНК. Многомерная и нелинейная регрессия. Исследование факторов на предмет мультиколлинеарности, решение проблемы мультиколлинеарности. Использование машинного обучения в области международных отношений. Предсказание политических и экономических показателей: примеры реальных исследований. Отслеживание националистических настроений в разных странах, исследование общественного мнения в режиме реального времени во время международных кризисов. Предсказание массовых протестов, результатов выборов. Семинар Построение регрессионной модели с помощью инструментов python (библиотека sklearn), интерпретация получившихся результатов. Создание фиктивных (dummy) переменных. Реализация классификации с помощью инструментов python (библиотека sklearn), интерпретация получившихся результатов
- Визуализация данныхЛекции Статистическая визуализация. График плотности распределения. Диаграммы рассеяния. Гистограммы. Столбиковые диаграммы. Линейные диаграммы. Коробчатые диаграммы. Круговые диаграммы. Необычные типы диаграмм. Удачные и неудачные варианты визуализации данных. Подбор графического представления для различных результатов исследований. Семинары Библиотеки python для визуализации данных: matplotlib, seaborn. Построение различных типов графиков, редактирование названия, осей, подписей осей, изменение цветов. Изображение нескольких графиков в одной области.
- Сетевой анализСетевой анализ в международных отношениях: распространение и области применения. Математический аппарат для сетевого анализа. Введение в теорию графов: основные понятия, вершины, ребра, типы графов. Представление графа в виде матрицы смежности. Основные понятия в анализе социальных сетей. Основные измеряемые свойства сетей. Плотность, центральности, кратчайший путь. Примеры исследований в международных отношениях с использованием анализа социальных сетей. Сетевой анализ международных организаций. Анализ режимов нераспространения. Сетевой анализ международных экономических отношений и некоммерческих организаций Семинары Библиотека networkx для работы с сетями. Построение сети по выгруженным данным. Подсчет основных метрик, построение гистограммы распределения степеней вершин, нахождение кратчайших путей. Редактирование визуального представления сети
Элементы контроля
- Компьютерное тестирование
- Командный проект
- Домашнее задание
- Контрольная работаКонтрольная работа проводится в письменной форме с использованием синхронного прокторинга. Контрольная работа проводится на платформе Онлайн-образование в НИУ ВШЭ (https://online.hse.ru/), прокторинг на платформе Экзамус (https://hse.student.examus.net). На платформе Экзамус доступно тестирование системы (https://lms.demo.examus.net/syscheck_st). Компьютер студента должен удовлетворять требованиям: https://elearning.hse.ru/data/2020/05/07/1544135594/Технические%20требования%20к%20ПК%20студента.pdf .
- Контрольная работа
- Экзамен (письменный)
Промежуточная аттестация
- Промежуточная аттестация (2 модуль)Выбирается лучшее (в пользу студента) из двух вариантов: а) 0.28 * Домашнее задание + 0.14 * Командный проект + 0.07 * Тесты + 0.21 * Контрольная работа + 0.3 * Экзамен (письменный) б) 0.28 * Домашнее задание + 0.20 * Командный проект + 0.07 * Компьютерное тестирование + 0.15 * Контрольная работа + 0.3 * Экзамен (письменный)