Бакалавриат
2024/2025
Научно-исследовательский семинар "Основы анализа данных"
Статус:
Курс обязательный (Политология)
Направление:
41.03.04. Политология
Кто читает:
Кафедра высшей математики
Где читается:
Факультет социальных наук
Когда читается:
3-й курс, 3 модуль
Формат изучения:
без онлайн-курса
Охват аудитории:
для своего кампуса
Преподаватели:
Тамбовцева Алла Андреевна
Язык:
русский
Кредиты:
1
Программа дисциплины
Аннотация
Lисциплина нацелена на развитие навыков обработки количественных данных в Python без углубления в математические основы и статистическую теорию. Элементы статистической теории в этом курсе используются, однако акцент делается на процедурах подготовки данных к анализу (чистка данных, фильтрация, группировка, агрегирование, элементы визуализации), а также использовании и интерпретации коэффициентов корреляции и регрессии (линейной и логистической) - наиболее широко применяемых инструментах анализа данных в социальных науках.
Цель освоения дисциплины
- освоение инструментов анализа данных в Python, подготовка к независимому экзамену по анализу данных
Планируемые результаты обучения
- различать корреляцию и каузацию по предложенным описаниям исследований
- уметь вычислять в Python коэффициент корреляции Пирсона и проверять его статистическую значимость
- уметь реализовывать в Python проверку независимости признаков в качественной шкале с помощью критерия хи-квадрат Пирсона
- различать по описанию исследования тип задачи машинного обучения
- уметь реализовывать в Python метод k-ближайших соседей
- уметь оценивать в Python модель линейной регрессии и интерпретировать полученные результаты
- уметь оценивать в Python модель логистической регрессии и интерпретировать полученные результаты
Содержание учебной дисциплины
- Меры связи
- Введение в машинное обучение
- Примеры прогнозирования в машинном обучении: линейная регрессия
- Примеры классификации в машинном обучении: логистическая регрессия
Элементы контроля
- HomeworkНабор теоретических и практических заданий в формате независимого экзамена по анализу данных. Практическая часть выполняется в Python. В процессе выполнения практической части запрещено использовать инструменты искусственного интеллекта (включая ChatGPT и его аналоги).
- ПрактикумНабор практических заданий в Python в формате задач части B и C независимого экзамена по анализу данных.
- TestПисьменная работа на 10 минут, включающая закрытые и открытые вопросы по пройденным темам.
- ЭкзаменНабор заданий в формате независимого экзамена по анализу данных.
Промежуточная аттестация
- 2024/2025 3rd module0.2 * Homework + 0.15 * Test + 0.2 * Практикум + 0.45 * Экзамен
Список литературы
Рекомендуемая основная литература
- Python и анализ данных : первичная обработка данных с применением pandas, NumPy и Jupiter, Маккинни, У., 2023
- Введение в статистическое обучение с примерами на языке R, Джеймс, Г., 2016
Рекомендуемая дополнительная литература
- Taieb, D. (2018). Data Analysis with Python : A Modern Approach. Birmingham, UK: Packt Publishing. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=1993344