• A
  • A
  • A
  • ABC
  • ABC
  • ABC
  • А
  • А
  • А
  • А
  • А
Regular version of the site

Data Analysis in Python

2024/2025
Academic Year
RUS
Instruction in Russian
4
ECTS credits
Course type:
Compulsory course
When:
2 year, 1, 2 module

Instructor


Беленков Вадим Евгеньевич

Программа дисциплины

Аннотация

Язык программирования Python широко используется в анализе данных о социальных, экономических, политических и иных процессах. Владение этим инструментом будет полезным как для студентов, готовящихся как к карьере в академической карьере, так и к работе на государственной службе или в бизнесе. В рамках этого курса студенты научатся использовать специализированные библиотеки языка Python для обработки и визуализации данных, проверки статистических гипотез, проведения регрессионного анализа и визуализации его результатов. После прохождения этого курса студенты смогут самостоятельно и профессионально проводить анализ данных по разнообразным проблемам, что повысит их ценность как специалистов и в науке, и на государственной службе, и в бизнесе.
Цель освоения дисциплины

Цель освоения дисциплины

  • Цели освоения этой учебной дисциплины: 1) овладение навыками использования языка программирования Python для анализа данных; 2) формирование способности корректно реализовывать количественные методы научных и аналитических исследований на языке Python
Планируемые результаты обучения

Планируемые результаты обучения

  • Формулировать содержание и функции конкретных количественных методов социальных исследований.
  • Интерпретировать результаты, полученные в ходе анализа данных с помощью количественных методов исследований, с точки зрения формальных статистических критериев.
  • Применять необходимые наборы библиотек и команд на языке программирования Python для обработки и анализа данных.
Содержание учебной дисциплины

Содержание учебной дисциплины

  • Введение в обработку данных
  • Непараметрические коэффициенты корреляции
  • Тестирование статистических гипотез в Python
  • Визуализация данных в Python
  • Решение задачи регрессии в Python: интервальные зависимые переменные
  • Решение задачи классификации с помощью логистической регрессии
Элементы контроля

Элементы контроля

  • неблокирующий Тесты в рамках онлайн-курса "Статистика для анализа данных"
    Среднее арифметическое баллов за все оцениваемые тесты онлайн-курса "Статистика для анализа данных". Перед расчётом среднего балла оценка за каждый тест приводится в единую шкалу от 0 до 10 по формуле 10*"оценка за индивидуальный тест"/ "максимально возможная оценка за индивидуальный тест" с округлением по правилам математики. В связи с тем, что онлайн-курс предполагает техническую возможность выполнения тестов без использования Python, для зачёта оценки от студентов требуется прислать свой программный код на языке Python, выполнняющий заданий теста. Преподаватель или учебный ассистент имеет право снизить оценку за тест в случае отсутствия кода в Python для решения какого-либо из заданий теста или в случае, если код или выдаваемый результат его исполнения ошибочен. Оценка снижается на количество баллов, предусмотренное заданием, с учётом перевода оценки за тест в единую шкалу. При выполнении домашних заданий запрещается использовать генеративные модели искусственного интеллекта.
  • неблокирующий Контрольная работа
    Правила проведения контрольной работы 1) Длительность - 1 час 10 мин с момента отправки данных преподавателем. 2) Вам нужно будет внести ответы в специальную форму в Smart LMS в течение 1 ч. 10 минут (всего есть 2 попытки, выставляется средняя оценка). Также Вам нужно сразу после отправки ответов загрузить файл .ipynb с кодом решения контрольной работы в другую специальную форму в Smart LMS. Отсутствие кода или неправильное решение/ответ в файле с кодом - основание для снижения оценки даже при правильных ответах в форме для ответов. 3) В ходе контрольной работы разрешается пользоваться своим листом бумаги формата A4, на котором может быть заранее (до контрольной работы) записана информации, касающаяся статистических методов анализа данных и/или языка Python, в том числе примеры команд и библиотек; 4) Контрольную работу следует выполнять на установленных в аудитории компьютерах, принадлежащих НИУ ВШЭ. Использование иных компьютеров при решении заданий контрольной работы допускается в исключительных случаях (технические проблемы на университетских компьютерах, отсутствие свободных университетских компьютеров) с предварительного согласия преподавателя, данного индивидуально каждому желающему использовать иное устройство студенту. 5) На контрольной работе запрещается: - пользоваться помощью других людей, включая коллег по курсу; - оказывать помощь коллегам по курсу в решении заданий; - переговариваться и переписываться с коллегами по курсу, в том числе помогать в осуществлении переговоров и переписки; - пользоваться генеративным искусственным интеллектом (Chat GPT и его аналоги); - пользоваться социальными сетями и мессенджерами; - пользоваться смартфонами и другими электронно-вычислительными машинами (ЭВМ), кроме компьютера, используемого для выполнения заданий; - пользоваться Интернетом (за исключением использования Smart LMS и облачных платформ для программирования на Python), открытие других страниц и сайтов может допускаться с предварительного индивидуального разрешения преподавателя. 6) Перемещения по аудитории и выход из аудитории без согласия преподавателя запрещены, за исключением ситуаций, связанных с непосредственной угрозой жизни и здоровью. При временном выходе из аудитории без окончательной сдачи работы все электронные технические средства (ЭВМ и средства связи) должны быть оставлены в аудитории. В одно и то же время временно отсутствовать в аудитории может только один студент. 6) За нарушение правил следует удаление из аудитории с проставлением нулевой оценки за контрольную работу. 7) Контрольная работа проводится очно. Дополнительные правила могут быть изложены в специальных формах на странице курса в Smart LMS.
  • блокирующий Экзамен
    Правила проведения экзамена 1) Длительность - 1 час 10 мин с момента отправки данных преподавателем. 2) Вам нужно будет внести ответы в специальную форму в Smart LMS в течение 1 ч. 10 минут (всего есть 2 попытки, выставляется средняя оценка). Также Вам нужно сразу после отправки ответов загрузить файл .ipynb с кодом решения экзамена в другую специальную форму в Smart LMS. Отсутствие кода или неправильное решение/ответ в файле с кодом - основание для снижения оценки даже при правильных ответах в форме для ответов. 3) В ходе экзамена разрешается пользоваться своим листом бумаги формата A4, на котором может быть заранее (до экзамена) записана информация, касающая статистических методов анализа данных и/или языка Python, в том числе примеры команд и библиотек; 4) Экзамен следует выполнять на установленных в аудитории компьютерах, принадлежащих НИУ ВШЭ. Использование иных компьютеров при решении заданий экзамена допускается в исключительных случаях (технические проблемы на университетских компьютерах, отсутствие свободных университетских компьютеров) с предварительного согласия преподавателя, данного индивидуально каждому желающему использовать иное устройство студенту. 5) На экзамене запрещается: - пользоваться помощью других людей, включая коллег по курсу; - оказывать помощь коллегам по курсу в решении заданий; - переговариваться и переписываться с коллегами по курсу, в том числе помогать в осуществлении переговоров и переписки; - пользоваться генеративным искусственным интеллектом (Chat GPT и его аналоги); - пользоваться социальными сетями и мессенджерами; - пользоваться смартфонами и другими электронно-вычислительными машинами (ЭВМ), кроме компьютера, используемого для выполнения заданий; - пользоваться Интернетом (за исключением использования Smart LMS и облачных платформ для программирования на Python), открытие других страниц и сайтов может допускаться с предварительного индивидуального разрешения преподавателя. 6) Перемещения по аудитории и выход из аудитории без согласия преподавателя запрещены, за исключением ситуаций, связанных с непосредственной угрозой жизни и здоровью. При временном выходе из аудитории без окончательной сдачи работы все электронные технические средства (ЭВМ и средства связи) должны быть оставлены в аудитории. В одно и то же время временно отсутствовать в аудитории может только один студент. 6) За нарушение правил следует удаление из аудитории с проставлением нулевой оценки за экзамен. 7) Экзамен проводится очно. Дополнительные правила могут быть изложены в специальных формах на странице курса в Smart LMS.
Промежуточная аттестация

Промежуточная аттестация

  • 2024/2025 2nd module
    0.35 * Контрольная работа + 0.3 * Тесты в рамках онлайн-курса "Статистика для анализа данных" + 0.35 * Экзамен
Список литературы

Список литературы

Рекомендуемая основная литература

  • Python for data analysis : data wrangling with pandas, numPy, and IPhython, Mckinney, W., 2017

Рекомендуемая дополнительная литература

  • Python для сложных задач : наука о данных и машинное обучение, Плас, Дж. В., 2018

Авторы

  • Беленков Вадим Евгеньевич
  • Прокофьев Вадим Николаевич