Бакалавриат
2024/2025![Цель освоения дисциплины](/f/src/global/i/edu/objectives.svg)
![Планируемые результаты обучения](/f/src/global/i/edu/results.svg)
![Содержание учебной дисциплины](/f/src/global/i/edu/sections.svg)
![Элементы контроля](/f/src/global/i/edu/controls.svg)
![Промежуточная аттестация](/f/src/global/i/edu/intermediate_certification.svg)
Научно-исследовательский семинар "Анализ данных в Python"
Статус:
Курс по выбору (Программная инженерия)
Направление:
09.03.04. Программная инженерия
Кто читает:
Департамент программной инженерии
Где читается:
Факультет компьютерных наук
Когда читается:
2-й курс, 1-3 модуль
Формат изучения:
без онлайн-курса
Охват аудитории:
для всех кампусов НИУ ВШЭ
Преподаватели:
Меликян Алиса Валерьевна
Язык:
русский
Кредиты:
3
Программа дисциплины
Аннотация
В результате освоения дисциплины студенты изучат возможности языка программирования Python для сбора, обработки и анализа данных. Студенты смогут осуществлять автоматизированный сбор данных из сети Интернет, предварительную обработку данных для последующей работы с ними, выбирать подходящий метод анализа в зависимости от типа данных и исследовательской задачи, проводить анализ данных и интерпретировать полученные результаты, представлять их в доступном для широкой аудитории виде.
Цель освоения дисциплины
- Развитие навыков анализа данных с использованием современных программных средств для проведения исследований.
Планируемые результаты обучения
- Уметь провести описательный анализ данных
- Уметь построить модель линейной регрессии и описать её
- Уметь построить модель логистической регрессии и описать её
- Уметь провести описательный анализ данных
- Уметь провести анализ взаимосвязей переменных и представить его результаты в виде, доступном для широкой аудитории
- Уметь провести графический анализ данных
- Уметь провести графический анализ данных
- Уметь провести сбор данных с веб-страниц и представить их в структурированном виде
- Уметь работать с разными типами файлов и данных
- Уметь построить кластерные модели на основе разных алгоритмов, выбрать оптимальную модель и описать ее.
- Уметь осуществлять автоматизированный сбор данных в сети Интернет.
- Уметь проводить анализ и прогнозирование временных рядов.
Содержание учебной дисциплины
- Введение в Python. Типы данных и переменные.
- Работа с данными
- Описательный анализ данных
- Графический анализ данных
- Анализ взаимосвязей переменных
- Регрессионный анализ данных
- Кластерный анализ данных
- Анализ временных рядов
- Сбор данных в сети Интернет
Элементы контроля
- Контрольная работа 2 (КР2)Задание, выполняемое самостоятельно за ограниченное время.
- Контрольная работа 1 (КР1)Задание, выполняемое самостоятельно за ограниченное время.
- Практические задания (ПЗ)Домашние задания, выдаваемые на каждом семинаре.
- Исследовательский проект (ИП)Подготовка и презентация творческого исследовательского проекта.
- Экзамен (Э)Экзамен проводится в письменной форме.
Промежуточная аттестация
- 2024/2025 3rd module0.2 * Исследовательский проект (ИП) + 0.15 * Контрольная работа 1 (КР1) + 0.15 * Контрольная работа 2 (КР2) + 0.2 * Практические задания (ПЗ) + 0.3 * Экзамен (Э)