We use cookies in order to improve the quality and usability of the HSE website. More information about the use of cookies is available here, and the regulations on processing personal data can be found here. By continuing to use the site, you hereby confirm that you have been informed of the use of cookies by the HSE website and agree with our rules for processing personal data. You may disable cookies in your browser settings.

  • A
  • A
  • A
  • ABC
  • ABC
  • ABC
  • А
  • А
  • А
  • А
  • А
Regular version of the site

Data Governance in Digital Ecosystems

2024/2025
Academic Year
RUS
Instruction in Russian
3
ECTS credits
Delivered at:
School of Communication
Course type:
Elective course
When:
2 year, 1, 2 module

Программа дисциплины

Аннотация

Дисциплина не состоится в 2024-2025 уч.г. Дисциплина направлена на освоение принципов управления данными в цифровых экосистемах. В рамках дисциплины студенты познакомятся с особенностями работы с базами данных – ClickHouse, MongoDB, Vertica, Postgre и др., получат практические навыки работы со встроенными инструментами ML в базах данных. В содержание дисциплины также входят: обзор и решение практических задач по обработке BD, моделирование и best practics; сравнительный анализ с OLAP, реляционными СУБД (Postgre, MS SQL Server), NoSQL (ElasticSearch, Mongo DB) и Hadoop.
Цель освоения дисциплины

Цель освоения дисциплины

  • Целью освоения дисциплины "Управление данными в цифровых экосистемах" является получение студентами знаний и навыков владения современными методами и средствами, предназначенными для обработки и хранения больших данных и построения аналитики по ним для задач обеспечения медиапланирования и управления рекламными кампаниями.
Планируемые результаты обучения

Планируемые результаты обучения

  • Знает основные принципы организации реляционных БД и хранилищ данных. Владеет основными методами обработки информации в реляционых БД, включая язык SQL. Умеет применять инструменты работы с хранилищами данных для решения задач аналитики в медиапланировании.
  • Имеет представление о месте и роли Big Data-инструментов в задачах медипланирования. Умеет применять инструментарий распределенной обработки данных и построения аналитики на промышленных массивах данных.
  • Понимает основные принципы работы NoSQL-баз данных и их отличия от реляционных БД. Умеет применять полученные знания в задачах обработки больших данных с помощью NoSQL-инструментов для получения аналитической отчетности.
  • Понимает, как организованы процессы управления данными в организациях и цифровых экосистемах.
Содержание учебной дисциплины

Содержание учебной дисциплины

  • Data Governance: основы управления данными в компаниях и цифровых экосистемах
  • NoSQL – базы данных
  • Основные концепции организации реляционных баз данных и хранилища данных (DWH)
  • Инструменты работы с Big Data
Элементы контроля

Элементы контроля

  • неблокирующий Решение бизнес-кейсов
  • неблокирующий Аудиторная работа
Промежуточная аттестация

Промежуточная аттестация

  • 2024/2025 1st module
    0.35 * Аудиторная работа + 0.65 * Решение бизнес-кейсов
Список литературы

Список литературы

Рекомендуемая основная литература

  • Dean, J., & Ghemawat, S. (2008). Mapreduce: Simplified Data Processing on Large Clusters. Communications of the ACM, 51(1), 107–113. https://doi.org/10.1145/1327452.1327492
  • Kimball R., Margy Ross M. The Data Warehouse Toolkit: The Complete Guide to Dimensional Modeling. – John Wiley & Sons, 2013.
  • Luu H. Beginning Apache Spark 2: With Resilient Distributed Datasets, Spark SQL, Structured Streaming and Spark Machine Learning Library. – Berkeley: Apress, 2018.
  • Rohan Light, Beenish Saeed, Nathalie de Marcellis-Warin, Abdelaziz Khadraoui, Alison Holt, Benoit Aubert, David Sutton, Frédéric Gelissen, Alisdair McKenzie, Geoff Clarke, Rose Pan, & Ming Li. (2021). Data Governance : Governing Data for Sustainable Business. BCS, The Chartered Institute for IT.

Рекомендуемая дополнительная литература

  • Evren Eryurek, Uri Gilad, Valliappa Lakshmanan, Anita Kibunguchy-Grant, & Jessi Ashdown. (2021). Data Governance: The Definitive Guide: Vol. First edition. O’Reilly Media.
  • John Ladley. (2020). Data Governance : How to Design, Deploy, and Sustain an Effective Data Governance Program: Vol. Second edition. Academic Press.
  • White T. Hadoop: The Definitive Guide. - O'Reilly Media, 2015.

Авторы

  • Грызунова Елена Аркадьевна