• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта
2022/2023

Архитектура решений для бизнес-аналитики на основе данных

Статус: Маго-лего
Когда читается: 1, 2 модуль
Охват аудитории: для своего кампуса
Язык: русский
Кредиты: 6
Контактные часы: 48

Программа дисциплины

Аннотация

Курс направлен на: • Обзор и решение практических задач по выбору решений для обработки данных и моделирования • Сравнительный анализ с OLAP, реляционными СУБД (Postgres), NoSQL (ElasticSearch, Mongo DB) и Hadoop и примеры решения практических задач. • Обзор процессов и методологий, связанных с аналитикой данных. • Обзор типовых технических решений для аналитики и принципов их эксплуатации. • Освоение принципов управления данными в компаниях и цифровых экосистемах.
Цель освоения дисциплины

Цель освоения дисциплины

  • • Целью освоения дисциплины " Архитектура решений для бизнес-аналитики на основе данных" является получение студентами знаний технологиях анализа данных и навыков владения современными методами и средствами, предназначенными для обработки и хранения данных и построения аналитики по ним для задач бизнес и дата аналитики.
Планируемые результаты обучения

Планируемые результаты обучения

  • Воспроизводит основные принципы организации реляционных БД и хранилищ данных.
  • Владеет основными методами обработки информации в реляционых БД, включая язык SQL.
  • Применяет инструментарий распределенной обработки данных и построения аналитики на промышленных массивах данных.
  • Применяет полученные знания в задачах обработки больших данных с помощью NoSQL-инструментов для получения аналитической отчетности.
  • Применяет инструменты работы с хранилищами данных для решения задач аналитики данных.
  • Воспроизводит основные принципы работы NoSQL-баз данных и определяет их отличия от реляционных БД.
  • Определяет место и роль Big Data-инструментов в задачах аналитики
  • Описывает, как организованы процессы управления данными в организациях и цифровых экосистемах.
Содержание учебной дисциплины

Содержание учебной дисциплины

  • Основные концепции организации реляционных баз данных и хранилища данных (DWH)
  • NoSQL – базы данных
  • Инструменты работы с Big Data
  • Data Governance: основы управления данными в компаниях и цифровых экосистемах
Элементы контроля

Элементы контроля

  • неблокирующий Аудиторная работа
  • неблокирующий Решение бизнес-кейсов
  • блокирующий Экзамен
    Защита проектов в составе мини-групп
Промежуточная аттестация

Промежуточная аттестация

  • 2022/2023 учебный год 2 модуль
    0.3 * Аудиторная работа + 0.45 * Решение бизнес-кейсов + 0.25 * Экзамен
Список литературы

Список литературы

Рекомендуемая основная литература

  • Dean, J., & Ghemawat, S. (2008). Mapreduce: Simplified Data Processing on Large Clusters. Communications of the ACM, 51(1), 107–113. https://doi.org/10.1145/1327452.1327492
  • Kimball R., Margy Ross M. The Data Warehouse Toolkit: The Complete Guide to Dimensional Modeling. – John Wiley & Sons, 2013.
  • Luu H. Beginning Apache Spark 2: With Resilient Distributed Datasets, Spark SQL, Structured Streaming and Spark Machine Learning Library. – Berkeley: Apress, 2018.
  • Rohan Light, Beenish Saeed, Nathalie de Marcellis-Warin, Abdelaziz Khadraoui, Alison Holt, Benoit Aubert, David Sutton, Frédéric Gelissen, Alisdair McKenzie, Geoff Clarke, Rose Pan, & Ming Li. (2021). Data Governance : Governing Data for Sustainable Business. BCS, The Chartered Institute for IT.

Рекомендуемая дополнительная литература

  • Evren Eryurek, Uri Gilad, Valliappa Lakshmanan, Anita Kibunguchy-Grant, & Jessi Ashdown. (2021). Data Governance: The Definitive Guide: Vol. First edition. O’Reilly Media.
  • John Ladley. (2020). Data Governance : How to Design, Deploy, and Sustain an Effective Data Governance Program: Vol. Second edition. Academic Press.
  • White T. Hadoop: The Definitive Guide. - O'Reilly Media, 2015.

Авторы

  • Хапаева Наталья Михайловна
  • Яковлева Наталия Вадимовна