• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта
Бакалавриат 2024/2025

Научно-исследовательский семинар "Дата-инжиниринг"

Статус: Курс по выбору (Программная инженерия)
Направление: 09.03.04. Программная инженерия
Когда читается: 4-й курс, 1-3 модуль
Формат изучения: без онлайн-курса
Охват аудитории: для всех кампусов НИУ ВШЭ
Язык: русский
Кредиты: 3

Программа дисциплины

Аннотация

НИС "Data Engineering" посвящен работе инженеров данных, обеспечивающих фундамент аналитического процесса - доставку данных на стол к аналитику. Чтобы это произошло, кто-то должен обеспечить их поиск, загрузку по требуемому расписанию или запросу, проверку, преобразование в пригодный для использования вид и защиту с учетом ролей пользователей. На семинаре мы поговорим об азах профессии Data Engineer: как и где данные хранятся, что делать, если данные не годятся для использования и как сократить затраты на выполнение аналитики. Студентов ждет много практики, на которой они своими руками будут решать инженерные задачи из жизни IT-подразделений российского бизнеса.
Цель освоения дисциплины

Цель освоения дисциплины

  • Получение представления об особенностях задач управления данными, их применении в бизнесе и практических навыках работы с инструментами data engineer.
Планируемые результаты обучения

Планируемые результаты обучения

  • Получите основы управления данными как дисциплины: структуры и источники данных, методы манипулирования данными
  • Понимание важности качества данных и как поддерживать его на высоком уровне
Содержание учебной дисциплины

Содержание учебной дисциплины

  • Структуры данных
  • Манипулирование данными
  • Очистка и проверка данных
  • Практика
  • Витрины с данными
  • Защита и маскировка данных
Элементы контроля

Элементы контроля

  • неблокирующий ДЗ
  • неблокирующий Экзамен
Промежуточная аттестация

Промежуточная аттестация

  • 2024/2025 3rd module
    0.5 * ДЗ + 0.5 * Экзамен
Список литературы

Список литературы

Рекомендуемая основная литература

  • Linoff, G. (2016). Data Analysis Using SQL and Excel: Vol. Second edition. Wiley.

Рекомендуемая дополнительная литература

  • Bradford S. Jones, & Marco R. Steenbergen. (1997). Modeling Multilevel Data Structures. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsbas&AN=edsbas.F4700E2E

Авторы

  • Лобок Татьяна Сергеевна
  • Пятов Алексей Александрович
  • Буцкая Евгения Александровна