Бакалавриат
2023/2024
Анализ данных в Python
Статус:
Курс обязательный (Государственное и муниципальное управление)
Направление:
38.03.04. Государственное и муниципальное управление
Кто читает:
Департамент политики и управления
Где читается:
Факультет социальных наук
Когда читается:
2-й курс, 1, 2 модуль
Формат изучения:
с онлайн-курсом
Онлайн-часы:
20
Охват аудитории:
для своего кампуса
Преподаватели:
Беленков Вадим Евгеньевич
Язык:
русский
Кредиты:
5
Контактные часы:
24
Программа дисциплины
Аннотация
Язык программирования Python широко используется в анализе данных о социальных, экономических, политических и иных процессах. Владение этим инструментом будет полезным как для студентов, готовящихся как к карьере в академической карьере, так и к работе на государственной службе или в бизнесе. В рамках этого курса студенты научатся использовать специализированные библиотеки языка Python для обработки и визуализации данных, проверки статистических гипотез, проведения регрессионного анализа и визуализации его результатов. После прохождения этого курса студенты смогут самостоятельно и профессионально проводить анализ данных по разнообразным проблемам, что повысит их ценность как специалистов и в науке, и на государственной службе, и в бизнесе.
Цель освоения дисциплины
- Цели освоения этой учебной дисциплины: 1) овладение навыками использования языка программирования Python для анализа данных; 2) формирование способности корректно реализовывать количественные методы научных и аналитических исследований на языке Python
Планируемые результаты обучения
- Формулировать содержание и функции конкретных количественных методов социальных исследований.
- Интерпретировать результаты, полученные в ходе анализа данных с помощью количественных методов исследований, с точки зрения формальных статистических критериев.
- Применять необходимые наборы библиотек и команд на языке программирования Python для обработки и анализа данных.
Содержание учебной дисциплины
- Введение в обработку данных
- Непараметрические коэффициенты корреляции
- Тестирование статистических гипотез в Python
- Визуализация данных в Python
- Решение задачи регрессии в Python: интервальные зависимые переменные
- Решение задачи классификации с помощью логистической регрессии
Элементы контроля
- ЭкзаменПравила проведения экзамена 1) Длительность - 1 час 10 мин с момента отправки данных преподавателем. 2) Вам нужно будет внести ответы в специальную форму в Smart LMS в течение 1 ч. 10 минут (всего есть 2 попытки, оценивается лучшая). Также Вам нужно сразу после отправки ответов загрузить файл .ipynb с кодом решения контрольной работы в другую специальную форму в Smart LMS. Отсутствие кода или неправильное решение/ответ в файле с кодом - основание для снижения оценки даже при правильных ответах в форме для ответов. 3) В ходе контрольной работы разрешается пользоваться: - материалами семинаров по нашему предмету - материалами онлайн-курса "Статистика для анализа данных" - поисковыми системами (браузерами) в сети Интернет - своими конспектами 4) На контрольной работе запрещается: - пользоваться помощью других людей: а) при поиске информации в Интернете запрещается запрашивать помощь других людей; смотреть опубликованную ранее информацию можно (за исключением решений экзаменационных работ по нашему курсу и ответов к ним, подготовленных другими людьми); б) в любом случае нельзя пользоваться помощью коллег по курсу (в том числе пользоваться предоставленными ими решениями экзаменационных заданий по нашему курсу и ответами на них, включая решения и ответы к другим вариантам заданий) в) по техническим и иным вопросам следует обращаться к преподавателю, но давать подсказки в решении задач он не может - оказывать помощь коллегам по курсу в решении заданий - переговариваться и переписываться с коллегами по курсу, в том числе помогать в осуществлении переговоров и переписки - пользоваться генеративным искусственным интеллектом (Chat GPT и его аналоги) - пользоваться социальными сетями и мессенджерами - пользоваться смартфонами и другими электронно-вычислительными машинами, кроме персональных компьютеров (университетстких или личных) и ноутбуков. Запреты имеют более высокую силу по сравнению с разрешениями. 5) При временном выходе из аудитории без окончательной сдачи работы все электронные технические средства (ЭВМ и средства связи) должны быть оставлены в аудитории. В одно и то же время отсутствовать в аудитории может только один студент. 6) За нарушение правил следует удаление из аудитории с проставлением нулевой оценки за экзамен. 7) Экзамен проводится очно. Дополнительные правила могут быть изложены в специальных формах на странице курса в Smart LMS.
- Контрольная работаРешение задач по анализу данных в Python
- Тесты в рамках онлайн-курса "Статистика для анализа данных"Среднее арифметическое баллов за все оцениваемые тесты онлайн-курса "Статистика для анализа данных". Перед расчётом среднего балла оценка за каждый тест приводится в единую шкалу от 0 до 10 по формуле 10*"оценка за индивидуальный тест"/ "максимально возможная оценка за индивидуальный тест" с округлением по правилам математики. В связи с тем, что онлайн-курс предполагает техническую возможность выполнения тестов без использования Python, для зачёта оценки от студентов требуется прислать свой программный код на языке Python, выполнняющий заданий теста. Преподаватель имеет право снизить оценку за тест в случае отсутствия кода в Python для решения какого-либо из заданий теста или в случае, если код или выдаваемый результат его исполнения ошибочен. Оценка снижается на количество баллов, предусмотренное заданием, с учётом перевода оценки за тест в единую шкалу.
Промежуточная аттестация
- 2023/2024 учебный год 2 модуль0.3 * Контрольная работа + 0.4 * Тесты в рамках онлайн-курса "Статистика для анализа данных" + 0.3 * Экзамен