We use cookies in order to improve the quality and usability of the HSE website. More information about the use of cookies is available here, and the regulations on processing personal data can be found here. By continuing to use the site, you hereby confirm that you have been informed of the use of cookies by the HSE website and agree with our rules for processing personal data. You may disable cookies in your browser settings.

  • A
  • A
  • A
  • ABC
  • ABC
  • ABC
  • А
  • А
  • А
  • А
  • А
Regular version of the site

Data Analysis Applications in the Development of Analytical Information Systems

2023/2024
Academic Year
RUS
Instruction in Russian
6
ECTS credits
Delivered at:
Department of Information and Analytical Systems: Joint Department with EC-leasing
Course type:
Elective course
When:
2 year, 1, 2 module

Instructors


Zhukova, Liudmila


Новиков Роман Сергеевич

Программа дисциплины

Аннотация

Основная цель курса «Прикладные методы анализа данных при создании информационно-аналитических систем» - формирование у слушателей системного взгляда на возможности и ограничения математического аппарата - машинного обучения, эконометрических и статистических методов, изучение опыта использования алгоритмов анализа данных для разработки и реализации ИАС в различных экономических сферах. Курс состоит из двух частей. Первая, теоретическая часть, посвящена изучению постановки и решения задач методами анализа данных, обычно представляемых в научной литературе под общим названием «Data Mining»: методы многомерной статистики и кластерного анализа, нейросетевые методы, методы нечеткой логики, генетические алгоритмы, деревья решений, экспертные системы. Во второй, практической части, изучаются особенности, этапы и технологии применения этих методов при создании информационно-аналитических систем, в том числе на языке проuраммирования Python.
Цель освоения дисциплины

Цель освоения дисциплины

  • Основными целями и результатами освоения дисциплины «Прикладные методы анализа данных при создании информационно-аналитических систем» являются: • Развитие и закрепление практических навыков в построении аналитических и информационных систем управления, включающих интеллектуальную обработку данных. • Систематизация знаний студентов о применении различных изученных статистических, математических методов анализа данных по изученным дисциплинам в рамках направления подготовки магистра 09.04.01 «Информатика и вычислительная техника» по образовательной программе «Компьютерные системы и сети»,в Департаменте компьютерной инженерии МИЭМ им. А.Н.Тихонова НИУ ВШЭ. • Приобретение студентами навыка разработки, построения и сопровождения корпоративных обучаемых экспертных систем, используемых для поддержки принятия решений.
Планируемые результаты обучения

Планируемые результаты обучения

  • Знает специфику зависимой переменной в модели бинарной логистической регрессии
  • Знает основные особенности и ограничения в использовании статистики выборочных обследований
  • Использует байесовские подходы к анализу данных. Применяет алгоритм Random Forest.
  • Знание основных методов предобработки данных
  • Знает основные типы данных, этапы предобработки данных, методы разведочного анализа данных
  • Владеет методами анализа: линейная регрессия, регрессионные деревья, случайный лес
  • Знает основные виды искусственных нейронных сетей, способы их обучения.
  • Анализирует статистические методы и модели, применение линейной и логистической регрессионных моделей, кластерного и факторного анализа, методов дерева решений для решения экономических задач и поддержки принятия решений.
  • Понимать принципы визуализация данных и построения эффективных панелей индикаторов
  • Изучить метод Монте-Карло, его достоинства и недостатки.
  • Владеет понятием логистической регрессии. Знает метод опорных векторов (SVM). Владеет понятием трюка с ядрами. Знает метод ближайших соседей. Владеет понятием классификационных деревьев.
  • Сравнивать задачи классификации и задачи регрессии. Иллюстрировать задачи классификации (бинарной и множественной). Сравнивать наиболее известные классификаторы (логистическая регрессия, деревья решений, случайный лес, метод опорных векторов).
  • Понятия интеллектуального анализа данных, обзор задач интеллектуального анализа; упрощенный алгоритм Байеса, деревья решений, алгоритмы кластеризации.
  • Корректно применяет ансамбли моделей Random Forest и Gradient Boosting в машинном обучении
  • Умеет строить модель логистической регрессии и проводить ее диагностику
  • Выполняет предобработку данных. Строит регрессионные и тематические модели. Объясняет основные понятия машинного обучения.
  • Интерпретировать коэффициенты логистической регрессии и предельные эффекты
  • Знать и уметь применять Метод Монте-Карло
  • Уметь специфицировать и оценить модель логистической регрессии.
Содержание учебной дисциплины

Содержание учебной дисциплины

  • Особенности применения статистических и математических методов моделирования аналитических ИС
  • Построение математических моделей и проверка адекватности результатов моделирования при разработке ИАС
  • Основы использования ML при построении автоматизированных ИС для решения прикладных задач с помощью методов машинного обучения
  • Метод Монте-Карло, прогнозирование и экспорт результатов в ИАС
Элементы контроля

Элементы контроля

  • неблокирующий Активность на семинаре
    Преподаватель оценивает участие студентов на практических занятиях: активность студентов на практических занятиях в дискуссиях и обсуждениях, полноту раскрытия выбранных тем при выступлении с докладами по итогам индивидуальных письменных исследовательских работ, оформление индивидуальных письменных исследовательских работы и презентаций. На семинарских занятиях предусмотрено онлайн тестирование по пройденному материалу, на 10-15 минут.
  • неблокирующий Самостоятельная исследовательская работа
    Индивидуальная письменная исследовательская работа и Доклад по ее результатам с презентацией. Подготовка индивидуальных письменных исследовательских работ (отчетов), посвященных решению практической задачи аналитической обработки данных, которые сдаются студентом в итоговом виде в конце модуля, по одной работе на каждый модуль.
  • неблокирующий Экзамен
    Экзамен в конце второго модуля проходит в письменной форме. Студент решает теоретические и практические задачи в течение 1 ч 20 минут, оценка выставляется по 10-балльной шкале.
Промежуточная аттестация

Промежуточная аттестация

  • 2023/2024 учебный год 2 модуль
    0.3 * Активность на семинаре + 0.3 * Самостоятельная исследовательская работа + 0.4 * Экзамен
Список литературы

Список литературы

Рекомендуемая основная литература

  • 40 алгоритмов, которые должен знать каждый программист на Python. - 978-5-4461-1908-0 - Ахмад Имран - 2023 - Санкт-Петербург: Питер - https://ibooks.ru/bookshelf/390129 - 390129 - iBOOKS
  • Derivatives analytics with Python : data analysis, models, simulation, calibration and hedging, Hilpisch, Y. J., 2015
  • Machine Learning in R: Random Forest for Cybersport and iGaming. (2019). https://doi.org/10.5281/zenodo.2572680
  • Richert, W., & Coelho, L. P. (2013). Building Machine Learning Systems with Python. Birmingham: Packt Publishing. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=619996
  • Барский, А. Б. Введение в нейронные сети : учебное пособие / А. Б. Барский. — 2-е изд. — Москва : ИНТУИТ, 2016. — 358 с. — Текст : электронный // Лань : электронно-библиотечная система. — URL: https://e.lanbook.com/book/100684 (дата обращения: 00.00.0000). — Режим доступа: для авториз. пользователей.
  • Боев, В. Д.  Имитационное моделирование систем : учебное пособие для вузов / В. Д. Боев. — Москва : Издательство Юрайт, 2023. — 253 с. — (Высшее образование). — ISBN 978-5-534-04734-9. — Текст : электронный // Образовательная платформа Юрайт [сайт]. — URL: https://urait.ru/bcode/514932 (дата обращения: 27.08.2024).
  • Бутусов Олег Борисович, Butusov Oleg Borisovich, Джулай Анна Алексеевна, & Dzhulai Anna Alekseevna. (2018). Применение методов визуального моделирования и программирования в образовательном процессе по дисциплине «Нейронные сети». Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsbas&AN=edsbas.E28243B
  • Войтов, А. Г. Наглядность, визуалистика, инфографика системного анализа : учебное пособие / А. Г. Войтов. - 7-е изд. - Москва : Дашков и К, 2022. - 212 с. - ISBN 978-5-394-05090-9. - Текст : электронный. - URL: https://znanium.com/catalog/product/1926412
  • Вьюненко, Л. Ф.  Имитационное моделирование : учебник и практикум для вузов / Л. Ф. Вьюненко, М. В. Михайлов, Т. Н. Первозванская ; под редакцией Л. Ф. Вьюненко. — Москва : Издательство Юрайт, 2022. — 283 с. — (Высшее образование). — ISBN 978-5-534-01098-5. — Текст : электронный // Образовательная платформа Юрайт [сайт]. — URL: https://urait.ru/bcode/489074 (дата обращения: 27.08.2024).
  • Демидова, О. А.  Эконометрика : учебник и практикум для вузов / О. А. Демидова, Д. И. Малахов. — Москва : Издательство Юрайт, 2023. — 334 с. — (Высшее образование). — ISBN 978-5-534-00625-4. — Текст : электронный // Образовательная платформа Юрайт [сайт]. — URL: https://urait.ru/bcode/511223 (дата обращения: 27.08.2024).
  • Имитационное моделирование : учебное пособие, Строгалев, В. П., 2015
  • Искусственные нейронные сети : теория и практика, Круглов, В. В., 2002
  • Коэльо, Л. П. Построение систем машинного обучения на языке Python / Л. П. Коэльо, В. Ричарт , перевод с английского А. А. Слинкин. — 2-е изд. — Москва : ДМК Пресс, 2016. — 302 с. — ISBN 978-5-97060-330-7. — Текст : электронный // Лань : электронно-библиотечная система. — URL: https://e.lanbook.com/book/82818 (дата обращения: 00.00.0000). — Режим доступа: для авториз. пользователей.
  • Методы машинного обучения в Data Mining пакета STATISTICA : учебное пособие для вузов, Халафян, А. А., 2022
  • Нейронные сети для обработки информации, Осовский, С., 2004
  • Нейронные сети. Полный курс : пер. с англ., Хайкин, С., 2018
  • Основы машинного обучения - Лимановская О.В., Алферьева Т.И. - ФЛИНТА - 2022 - https://znanium.com/catalog/product/1891377 - 957065 - ZNANIUM
  • Практикум по эконометрике : учеб. пособие, Демидова, О. А., 2010
  • Практическая бизнес - статистика, Сигел, Э. Ф., 2004
  • Рашка, С. Python и машинное обучение: крайне необходимое пособие по новейшей предсказательной аналитике, обязательное для более глубокого понимания методологии машинного обучения : руководство / С. Рашка , перевод с английского А. В. Логунова. — Москва : ДМК Пресс, 2017. — 418 с. — ISBN 978-5-97060-409-0. — Текст : электронный // Лань : электронно-библиотечная система. — URL: https://e.lanbook.com/book/100905 (дата обращения: 00.00.0000). — Режим доступа: для авториз. пользователей.
  • Ростовцев, В. С. Искусственные нейронные сети / В. С. Ростовцев. — 3-е изд., стер. — Санкт-Петербург : Лань, 2023. — 216 с. — ISBN 978-5-507-46446-3. — Текст : электронный // Лань : электронно-библиотечная система. — URL: https://e.lanbook.com/book/310184 (дата обращения: 00.00.0000). — Режим доступа: для авториз. пользователей.
  • Соробин, А. Б. Сверточные нейронные сети: примеры реализаций : учебно-методическое пособие / А. Б. Соробин. — Москва : РТУ МИРЭА, 2020. — 159 с. — Текст : электронный // Лань : электронно-библиотечная система. — URL: https://e.lanbook.com/book/163853 (дата обращения: 00.00.0000). — Режим доступа: для авториз. пользователей.
  • Эконометрика. Начальный курс, учебник, 8-е изд., 504 с., Магнус, Я. Р., Катышев, П. К., Пересецкий, А. А., 2007

Рекомендуемая дополнительная литература

  • Имитационное моделирование : теория и технологии, Рыжиков, Ю. И., 2004

Авторы

  • Жукова Людмила Вячеславовна