• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта
Бакалавриат 2024/2025

Научно-исследовательский семинар "Анализ данных в Python"

Статус: Курс по выбору (Программная инженерия)
Направление: 09.03.04. Программная инженерия
Когда читается: 2-й курс, 1-3 модуль
Формат изучения: без онлайн-курса
Охват аудитории: для всех кампусов НИУ ВШЭ
Язык: русский
Кредиты: 3

Программа дисциплины

Аннотация

В результате освоения дисциплины студенты изучат возможности языка программирования Python для сбора, обработки и анализа данных. Студенты смогут осуществлять автоматизированный сбор данных из сети Интернет, предварительную обработку данных для последующей работы с ними, выбирать подходящий метод анализа в зависимости от типа данных и исследовательской задачи, проводить анализ данных и интерпретировать полученные результаты, представлять их в доступном для широкой аудитории виде.
Цель освоения дисциплины

Цель освоения дисциплины

  • Развитие навыков анализа данных с использованием современных программных средств для проведения исследований.
Планируемые результаты обучения

Планируемые результаты обучения

  • Уметь провести описательный анализ данных
  • Уметь построить модель линейной регрессии и описать её
  • Уметь построить модель логистической регрессии и описать её
  • Уметь провести описательный анализ данных
  • Уметь провести анализ взаимосвязей переменных и представить его результаты в виде, доступном для широкой аудитории
  • Уметь провести графический анализ данных
  • Уметь провести графический анализ данных
  • Уметь провести сбор данных с веб-страниц и представить их в структурированном виде
  • Уметь работать с разными типами файлов и данных
  • Уметь построить кластерные модели на основе разных алгоритмов, выбрать оптимальную модель и описать ее.
  • Уметь осуществлять автоматизированный сбор данных в сети Интернет.
  • Уметь проводить анализ и прогнозирование временных рядов.
Содержание учебной дисциплины

Содержание учебной дисциплины

  • Введение в Python. Типы данных и переменные.
  • Работа с данными
  • Описательный анализ данных
  • Графический анализ данных
  • Анализ взаимосвязей переменных
  • Регрессионный анализ данных
  • Кластерный анализ данных
  • Анализ временных рядов
  • Сбор данных в сети Интернет
Элементы контроля

Элементы контроля

  • неблокирующий Контрольная работа 2 (КР2)
    Задание, выполняемое самостоятельно за ограниченное время.
  • неблокирующий Контрольная работа 1 (КР1)
    Задание, выполняемое самостоятельно за ограниченное время.
  • неблокирующий Практические задания (ПЗ)
    Домашние задания, выдаваемые на каждом семинаре.
  • неблокирующий Исследовательский проект (ИП)
    Подготовка и презентация творческого исследовательского проекта.
  • неблокирующий Экзамен (Э)
    Экзамен проводится в письменной форме.
Промежуточная аттестация

Промежуточная аттестация

  • 2024/2025 3rd module
    0.2 * Исследовательский проект (ИП) + 0.15 * Контрольная работа 1 (КР1) + 0.15 * Контрольная работа 2 (КР2) + 0.2 * Практические задания (ПЗ) + 0.3 * Экзамен (Э)
Список литературы

Список литературы

Рекомендуемая основная литература

  • Изучаем Python, Лутц, М., 2014

Рекомендуемая дополнительная литература

  • Python и анализ данных, Маккинни, У., 2015

Авторы

  • Меликян Алиса Валерьевна
  • Буцкая Евгения Александровна