В старых версиях браузеров сайт может отображаться некорректно. Для оптимальной работы с сайтом рекомендуем воспользоваться современным браузером.
Мы используем файлы cookies для улучшения работы сайта НИУ ВШЭ и большего удобства его использования. Более подробную информацию об использовании файлов cookies можно найти здесь, наши правила обработки персональных данных – здесь. Продолжая пользоваться сайтом, вы подтверждаете, что были проинформированы об использовании файлов cookies сайтом НИУ ВШЭ и согласны с нашими правилами обработки персональных данных. Вы можете отключить файлы cookies в настройках Вашего браузера.
для предложений и замечаний, направленных на улучшение деятельности университета и повышение качества образования
Нашли опечатку?
Выделите её, нажмите Ctrl+Enter и отправьте нам уведомление. Спасибо за участие!
Сервис предназначен только для отправки сообщений об орфографических и пунктуационных ошибках.
Учебный план
Аннотации учебных дисциплин
Развернуть все
Семинар наставника
Данный курс представляет собой ключевую часть образовательного процесса магистратуры для будущих дата-инженеров. В ходе обучения студенты будут вовлечены в обмен опытом с профессионалами в области дата-инженерии, которые выступят в роли наставников. В рамках семинара студенты будут работать над реальными проектами, применяя свои навыки в практических задачах под руководством наставников. Семинар также будет посвящен развитию мягких навыков, таких как коммуникация, руководство, аналитическое мышление и принятие решений, что является важным аспектом успешной карьеры в данной области.
Теория вероятностей и математическая статистика
Данный курс предоставляет студентам возможность ознакомиться с основными понятиями теории вероятностей и математической статистики. В рамках курса изучаются базовые формулы и теоремы теории вероятностей и математической статистики, законы распределения случайных величин и их характеристики, а также методы статистического описания данных. Студенты также получают навыки постановки и решения задач математической статистики.
Алгоритмический инструментарий
Данный курс предлагает практическое введение в ключевые алгоритмы и концепции, составляющие основу современного алгоритмического инструментария. Особое внимание уделяется пониманию теоретических принципов высокого уровня, лежащих в основе рассматриваемых алгоритмов, а также развитию навыков применения и реализации алгоритмов в конкретных ситуациях. Студенты получат возможность решать вычислительные задачи, разрабатывать новые алгоритмы и эффективно реализовывать решения. В конце курса студенты реализуют Capstone Project.
Python для инженерии данных
Данный курс предоставляет глубокое понимание и навыки работы с языком программирования Python, с особым акцентом на его применении в анализе данных и инженерии данных. В рамках курса студенты изучают продвинутые аспекты Python, включая синтаксис, объектно-ориентированное программирование и возможности специализированных библиотек. Курс также включает изучение ключевых концепций и методов работы с данными, включая обработку больших объемов информации, многопоточное и асинхронное программирование в Python. Студенты приобретают навыки работы с библиотеками и фреймворками для анализа данных и визуализации на практике, а также изучают разработку Python-приложений для обработки и анализа данных.
ETL-процессы
Курс предоставляет студентам практические навыки в проектировании, разработке и управлении процессами ETL (Extract, Transform, Load). В ходе обучения студенты изучают методы извлечения, трансформации и загрузки данных в различные хранилища. Они также получают практические навыки в использовании инструментов и фреймворков ETL и изучают методы обработки ошибок и мониторинга процессов. Курс также рассматривает концепцию и модели облачных вычислений и современные практики разработки cloud-native приложений.
Дизайн систем
Данный курс предназначен для того, чтобы студенты могли освоить полный цикл проектирования систем. Он поможет развить навыки, необходимые для создания эффективной, надежной и функциональной системы. Курс также поможет студентам понять, какие технологии и инструменты следует использовать для создания такой системы, а также как митигировать риски. Это крайне важно для будущих специалистов в области информационных технологий, которые должны быть в курсе последних тенденций и новых технологий, чтобы создавать продукты, соответствующие потребностям пользователей.
Инструменты промышленной разработки
Данный курс предназначен для освоения работы с командной строкой, использования мощного текстового редактора, использования функций систем контроля версий и многого другого. На занятиях будет рассмотрен дизайн и внутренности этих инструментов, чтобы студенты в будущем свободно владели и понимали остальных разработчиков, а также думали в рамках этих инструментов наиболее гибко. Курс охватывает все важные темы, которые необходимы для эффективной работы в области компьютерных наук и программирования. Занятия дают практическое знакомство с инструментами и методами, которые студенты смогут сразу же применить в самых разных ситуациях, с которыми им придется столкнуться.
Алгоритмы и структуры данных в прикладных задачах
Данный курс представляет собой изучение прикладных задач из различных сфер деятельности, их математических моделей и методов решения на основе современной теории оптимизации. В рамках курса рассматриваются новые алгоритмы, основанные на комплексном применении динамического программирования и метода ветвей и границ, доведённые до практических реализаций.
Информационные системы
Курс предоставляет студентам знания и навыки в области создания, внедрения и эксплуатации информационных систем, включая методологии и стандарты управления ими. Студенты изучат стадии жизненного цикла информационных систем и научатся реализовывать соответствующие процессы. Они также приобретут практические навыки в описании бизнес-процессов, формировании требований при проектировании и создании информационных систем, выборе технологического стека и способов интеграции системы в корпоративный IT-ландшафт.
Java и объектно-ориентированное программирование
Данный курс знакомит слушателей с языком программирования Java. Большое внимание уделяется изучению особенностей языка Java по сравнению с другими объектно-ориентированными языками, основных принципов многопоточного программирования. Будут затронуты фрагменты стандартной библиотеки включая коллекции, Stream API, средства для параллельного программирования. Также в курсе ознакомительно будут даны языки Scala и Kotlin.
Нереляционные базы данных
Данный курс предоставляет студентам углубленные знания о нереляционных базах данных, включая документоориентированные, ключ-значение, колоночные и графовые базы данных. Особое внимание уделяется изучению принципов проектирования и моделирования данных для нереляционных баз, а также сравнению с реляционными базами данных. Студенты получат возможность изучить эффективное использование нереляционных баз данных в различных сценариях, включая хранение и анализ данных с различными структурами, а также интеграцию с приложениями и сервисами для обеспечения масштабируемости и производительности. Курс также включает в себя изучение популярных систем управления нереляционными базами данных, а также практическое освоение инструментов и языков запросов для работы с данными в нереляционных базах.
Обработка и анализ больших массивов данных
Занятия проводятся после освоения дисциплин по построению хранилищ данных (DWH) и автоматизации загрузки данных (ETL). Основной акцент курса направлен на системы работы с большими данными в парадигме MapReduce. Помимо этих приложений курс также покрывает подходы к работе с данными в реальном времени - Spark Structured Streaming, Kafka и Flink. Студентам предлагается применить свои навыки на практике для реализации проекта, а также решения прикладных задач инфраструктурного, архитектурного и практического характера.
Безопасность компьютерных систем
Данный курс предоставляет студентам основы компьютерной безопасности, включая изучение угроз и уязвимостей, а также методов защиты и обеспечения конфиденциальности, целостности и доступности данных. Особое внимание уделяется анализу современных атак и техник, используемых злоумышленниками, и способам их предотвращения. Курс также включает в себя изучение практических аспектов безопасности компьютерных систем, таких как настройка сетевых устройств, обеспечение безопасности приложений и операционных систем, а также мониторинг и реагирование на инциденты безопасности. Студенты получат возможность практиковаться в проведении аудитов безопасности, оценке рисков и разработке стратегий защиты данных. Они также научатся соблюдать законодательные и регуляторные требования в области безопасности данных и проводить обучение и информирование персонала о мероприятиях по обеспечению безопасности.
Системы хранения данных
Данный курс предоставляет студентам углубленные знания о различных архитектурах и типах систем хранения данных, а также о базах данных и хранилищах данных для обработки больших объемов информации. Особое внимание уделяется современным тенденциям в области хранения данных, включая облачные решения и инфраструктуру как код. Студенты получат возможность изучить методы оптимизации производительности систем хранения данных, включая настройку индексов, запросов и конфигураций баз данных. Они также узнают о принципах обеспечения отказоустойчивости, высокой доступности и масштабируемости систем хранения. Курс также включает в себя практические задания, в ходе которых студенты будут разрабатывать и настраивать системы хранения данных, а также проводить анализ и оптимизацию существующих хранилищ данных.
MLOps
Данный курс предоставляет студентам комплекс теоретических знаний и методологических основ в области технологий построения пайплайнов для обслуживания ML-моделей, включая работу с данными и моделями в промышленных условиях. В ходе обучения студенты изучают концепции MLOps, DataOps, DevOps, включая процессы управления данными, автоматизацию и оптимизацию процессов, а также управление версиями данных. Они также получают практические навыки использования инструментов CI/CD для непрерывной интеграции, развертывания и тестирования данных.
SQL: моделирование и управление базами данных
Данный курс предоставляет студентам знания о современных методах и средствах организации баз данных с фокусом на классическую реляционную модель. В рамках курса студенты изучают концептуальное моделирование предметной области, даталогическое проектирование, использование языка запросов SQL и создание программных приложений, обращающихся к базам данных. В качестве сервера баз данных используется PostgreSQL.