We use cookies in order to improve the quality and usability of the HSE website. More information about the use of cookies is available here, and the regulations on processing personal data can be found here. By continuing to use the site, you hereby confirm that you have been informed of the use of cookies by the HSE website and agree with our rules for processing personal data. You may disable cookies in your browser settings.

  • A
  • A
  • A
  • ABC
  • ABC
  • ABC
  • А
  • А
  • А
  • А
  • А
Regular version of the site

Research and Design Seminar "CRISP-DM Metodology Project Management"

2024/2025
Academic Year
RUS
Instruction in Russian
9
ECTS credits
Delivered at:
School of Communication
Course type:
Compulsory course
When:
2 year, 1-3 module

Instructors


Коточигов Константин Львович

Программа дисциплины

Аннотация

Курс направлен на поэтапное освоение студентами стадий управления проектами в области интеллектуального анализа данных по межотраслевой методологии CRISP-DM, а также обучение новым методам аналитики и визуализации данных. Одной из задач проектно-исследовательского семинара является экспертная поддержка подготовки магистерского проекта (ВКР).
Цель освоения дисциплины

Цель освоения дисциплины

  • Целью дисциплины «Проектно-исследовательский семинар «Управление проектами по методологии CRISP-DM» является освоение студентами стадий управления проектами в области интеллектуального анализа данных по межотраслевой методологии CRISP-DM и развитие компетенций в области анализа и визуализации данных в коммуникациях.
Планируемые результаты обучения

Планируемые результаты обучения

  • Оценивает результаты моделирования с точки зрения качества анализа данных и бизнес-показателей.
  • Извлекает (парсит) данные с веб-ресурсов, используя пакеты для Python.
  • Использует продвинутые методы SQL для построения аналитики.
  • Осуществляет разведывательный анализ данных, объединяет и переформатирует данные.
  • Корректно интерпретирует бизнес-задачи коммуникационной индустрии.
  • Отличает бизнес-задачи от задач анализа данных.
  • Анализирует рынок и формулирует вопросы на выявление потребностей заказчика.
  • Строит и выбирает оптимальную модель анализа данных для решения бизнес-задачи.
  • Представляет результаты проекта по анализу данных в форме отчёта или презентации.
  • Визуализирует данные и создаёт интерактивные дэшборды с использованием библиотек Python / BI-инструментов
Содержание учебной дисциплины

Содержание учебной дисциплины

  • CRISP-DM: понимание бизнес-задач.
  • CRISP-DM: сбор и начальное изучение данных
  • CRISP-DM: предварительная обработка данных
  • CRISP-DM: моделирование.
  • CRISP-DM: оценка.
  • CRISP-DM: внедрение.
  • Визуализация данных и BI-инструменты
Элементы контроля

Элементы контроля

  • неблокирующий Презентация и обсуждение модели, используемой в ВКР.
  • неблокирующий Практическое задание по визуализации данных
  • неблокирующий Решение кейсов по взаимодействию с заказчиками
  • неблокирующий Практическая работа по объединению и предобработке данных.
  • неблокирующий Анализ данных с использованием продвинутых методов SQL
  • неблокирующий Скрейпинг данных с веб-сайта
Промежуточная аттестация

Промежуточная аттестация

  • 2024/2025 3rd module
    0.15 * Анализ данных с использованием продвинутых методов SQL + 0.15 * Практическая работа по объединению и предобработке данных. + 0.15 * Практическое задание по визуализации данных + 0.25 * Презентация и обсуждение модели, используемой в ВКР. + 0.15 * Решение кейсов по взаимодействию с заказчиками + 0.15 * Скрейпинг данных с веб-сайта
Список литературы

Список литературы

Рекомендуемая основная литература

  • Python для data science. - 978-5-4461-2392-6 - Васильев Юлий - 2023 - Санкт-Петербург: Питер - https://ibooks.ru/bookshelf/390133 - 390133 - iBOOKS
  • SQL. Сборник рецептов. — 2-е изд.: Пер. с англ. - 978-5-9775-6759-6 - Молинаро Э., Грааф Р. - 2022 - Санкт-Петербург: БХВ-Петербург - https://ibooks.ru/bookshelf/380028 - 380028 - iBOOKS
  • Гинько, А. Ю. Анализ и визуализация данных в Yandex DataLens. Подробное руководство: от новичка до эксперта : руководство / А. Ю. Гинько. — Москва : ДМК Пресс, 2022. — 356 с. — ISBN 978-5-93700-171-9. — Текст : электронный // Лань : электронно-библиотечная система. — URL: https://e.lanbook.com/book/314909 (дата обращения: 00.00.0000). — Режим доступа: для авториз. пользователей.
  • Груздев, А. В. Предварительная подготовка данных в Python / А. В. Груздев. — Москва : ДМК Пресс, 2023 — Том 1 : Инструменты и валидация — 2023. — 816 с. — ISBN 978-5-93700-156-6. — Текст : электронный // Лань : электронно-библиотечная система. — URL: https://e.lanbook.com/book/314945 (дата обращения: 00.00.0000). — Режим доступа: для авториз. пользователей.
  • Груздев, А. В. Предварительная подготовка данных в Python / А. В. Груздев. — Москва : ДМК Пресс, 2023 — Том 2 : План, примеры и метрики качества — 2023. — 814 с. — ISBN 978-5-93700-177-1. — Текст : электронный // Лань : электронно-библиотечная система. — URL: https://e.lanbook.com/book/314948 (дата обращения: 00.00.0000). — Режим доступа: для авториз. пользователей.
  • Кондрашов, Ю. Н., Язык SQL. Сборник ситуационных задач по дисциплине «Базы данных» : учебно-практическое пособие / Ю. Н. Кондрашов. — Москва : Русайнс, 2023. — 125 с. — ISBN 978-5-466-02005-2. — URL: https://book.ru/book/947081 (дата обращения: 27.08.2024). — Текст : электронный.
  • Лысенкова, С. Н. «Распределенные базы данных». Основы языка SQL : учебное пособие / С. Н. Лысенкова. — Брянск : Брянский ГАУ, 2022. — 36 с. — Текст : электронный // Лань : электронно-библиотечная система. — URL: https://e.lanbook.com/book/305006 (дата обращения: 00.00.0000). — Режим доступа: для авториз. пользователей.
  • Маккинни, У. Python и анализ данных. Первичная обработка данных с применением pandas, NumPy и Jupiter : справочник / У. Маккинни , перевод с английского А. А. Слинкина. — 3-е изд. — Москва : ДМК Пресс, 2023. — 536 с. — ISBN 978-5-93700-174-0. — Текст : электронный // Лань : электронно-библиотечная система. — URL: https://e.lanbook.com/book/348086 (дата обращения: 00.00.0000). — Режим доступа: для авториз. пользователей.
  • Маркин, А. В.  Программирование на SQL : учебное пособие для среднего профессионального образования / А. В. Маркин. — Москва : Издательство Юрайт, 2023. — 435 с. — (Профессиональное образование). — ISBN 978-5-534-11093-7. — Текст : электронный // Образовательная платформа Юрайт [сайт]. — URL: https://urait.ru/bcode/518166 (дата обращения: 27.08.2024).
  • Маркин, А. В.  Программирование на SQL в 2 ч. Часть 1 : учебник и практикум для вузов / А. В. Маркин. — 3-е изд., перераб. и доп. — Москва : Издательство Юрайт, 2023. — 429 с. — (Высшее образование). — ISBN 978-5-534-15817-5. — Текст : электронный // Образовательная платформа Юрайт [сайт]. — URL: https://urait.ru/bcode/509818 (дата обращения: 28.08.2023).
  • Маркин, А. В.  Программирование на SQL в 2 ч. Часть 2 : учебник и практикум для вузов / А. В. Маркин. — 3-е изд., испр. и доп. — Москва : Издательство Юрайт, 2023. — 385 с. — (Высшее образование). — ISBN 978-5-534-15818-2. — Текст : электронный // Образовательная платформа Юрайт [сайт]. — URL: https://urait.ru/bcode/509819 (дата обращения: 28.08.2023).
  • Титов, А. Н. Визуализация данных в Python. Работа с библиотекой Matplotlib : учебно-методическое пособие / А. Н. Титов, Р. Ф. Тазиева. — Казань : КНИТУ, 2022. — 92 с. — ISBN 978-5-7882-3176-1. — Текст : электронный // Лань : электронно-библиотечная система. — URL: https://e.lanbook.com/book/331025 (дата обращения: 00.00.0000). — Режим доступа: для авториз. пользователей.

Рекомендуемая дополнительная литература

  • 9781498751414 - Foster, Ian; Ghani, Rayid; Jarmin, Ron S.; Kreuter, Frauke; Lane, Julia I. - Big Data and Social Science : A Practical Guide to Methods and Tools - 2017 - CRC Press - https://search.ebscohost.com/login.aspx?direct=true&db=nlebk&AN=1353316 - nlebk - 1353316
  • Martin Oberhofer, Eberhard Hechler, Ivan Milman, Scott Schumacher, & Dan Wolfson. (2014). Beyond Big Data : Using Social MDM to Drive Deep Customer Insight. [N.p.]: IBM Press. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=1600785
  • Куслейка, Д. Визуализация данных при помощи дашбордов и отчетов в Excel / Д. Куслейка , перевод с английского А. Ю. Гинько. — Москва : ДМК Пресс, 2022. — 338 с. — ISBN 978-5-97060-966-8. — Текст : электронный // Лань : электронно-библиотечная система. — URL: https://e.lanbook.com/book/241169 (дата обращения: 00.00.0000). — Режим доступа: для авториз. пользователей.
  • Полковникова, Н. А. Анализ и визуализация данных в Microsoft Excel в примерах и задачах : практическое пособие / Н. А. Полковникова. - Москва ; Вологда : Инфра-Инженерия, 2023. - 172 с. - ISBN 978-5-9729-1485-2. - Текст : электронный. - URL: https://znanium.com/catalog/product/2092453

Авторы

  • Грызунова Елена Аркадьевна
  • Добромыслова Ксения Олеговна