2022/2023
Аналитика и большие данные
Статус:
Маго-лего
Кто читает:
Школа инноватики и предпринимательства
Когда читается:
3 модуль
Охват аудитории:
для всех
Язык:
русский
Кредиты:
3
Контактные часы:
48
Программа дисциплины
Аннотация
В курсе изучаются основы управления и руководства данными, чтобы студенты по завершению курса имели представление о жизненном цикле данных и как им управлять. Также знали, что такое большие данные и как устроен и какие методы входят в дата майнинг. В результате освоения дисциплины у студента формируется полноценное представление о том через какие этапы проходят данные, чтобы превратиться в знания и как этим процессом управлять.
Цель освоения дисциплины
- Сформировать у студентов компетенции для управления и руководством данными;
- Студент знает, как выглядит жизненный цикл данных и как им управлять;
- Cтуденты знает, какие основные процессы и задачи входят в процесс управления данными;
- Cтудент знает, что такое большие данные и их характеристики;
- Студент умеет, описывать архитектуру верхнего уровня необходимую для управления данными;
- Студент умеет, выделять основные статистики и предварительно очищать данные, определять и описывать их качество;
- Студент умеет, строить простые прогнозы на основе регрессионного анализа;
- Студент умеет, создавать простые отчеты в инструментах для бизнес-аналитики.
Планируемые результаты обучения
- Знает какие документы и как их создавать для корректного управления и руководства данными. Умеет выделять необходимые метрики для оценки качества и эффективности работы.
- Знает, 5 типовых видов структур данных. Умеет описывать большие данные и формулировать их полезность для бизнеса. Знает, что такое хранилища данных и причины их возникновения.
- Знает, как определять качество данных, и что можно сделать, чтобы его улучшить. Умеет, выделять основные статистики по данным и строить простые прогнозы на основе регрессии.
- Умеет построить отчет используя BI инструменты.
Содержание учебной дисциплины
- Тема 1. Управление и руководство данными.
- Тема 2. Архитектуры данных и введение в большие данные.
- Тема 3: Аналитика данных: подготовка и анализ данных.
- Тема 4: Визуализация и представление результатов.
Элементы контроля
- Домашнее задание 1.
- Домашнее задание 2.
- Домашнее задание 3.Построить прогноз на основе данных и проинтерпретировать его. Результат работы оформляется в виде отчета на 5-6 листов, с описанием основных статистик, преобразований + отдельным файлом предоставляется код
- Домашнее задание 4.
- ЭкзаменЭкзамен по дисциплине предоставляется в виде теста по материалам лекций.
Промежуточная аттестация
- 2022/2023 учебный год 3 модульФормула оценивания: Оитог = 0,3*Оэкз + 0,7Онакоп Оитог – итоговая оценка за курс Оэкз – оценка за экзамен Онакоп – накопленная оценка Онакоп = (Одз1 + Одз2 + Одз3 + Од4)*0,25 Где Одз1 – Домашнее задание 1 Одз2 – Домашнее задание 2 Одз3 – Домашнее задание 3 Одз4 – Домашнее задание 4.
Список литературы
Рекомендуемая основная литература
- Бизнес-аналитика: от данных к знаниям : учеб. пособие, Паклин Н.Б., Орешков В.И., 2010
Рекомендуемая дополнительная литература
- Linstedt, D., & Olschimke, M. (2015). Building a Scalable Data Warehouse with Data Vault 2.0. Amsterdam: Morgan Kaufmann. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=1065504
- Paulraj Ponniah. (2010). Data Warehousing Fundamentals for IT Professionals: Vol. 2nd ed. Wiley.