Магистратура
2023/2024
Прикладные методы анализа данных при создании информационно-аналитических систем
Статус:
Курс по выбору (Компьютерные системы и сети)
Направление:
09.04.01. Информатика и вычислительная техника
Когда читается:
2-й курс, 1, 2 модуль
Формат изучения:
без онлайн-курса
Охват аудитории:
для своего кампуса
Прогр. обучения:
Компьютерные системы и сети
Язык:
русский
Кредиты:
6
Контактные часы:
48
Программа дисциплины
Аннотация
Основная цель курса «Прикладные методы анализа данных при создании информационно-аналитических систем» - формирование у слушателей системного взгляда на возможности и ограничения математического аппарата - машинного обучения, эконометрических и статистических методов, изучение опыта использования алгоритмов анализа данных для разработки и реализации ИАС в различных экономических сферах. Курс состоит из двух частей. Первая, теоретическая часть, посвящена изучению постановки и решения задач методами анализа данных, обычно представляемых в научной литературе под общим названием «Data Mining»: методы многомерной статистики и кластерного анализа, нейросетевые методы, методы нечеткой логики, генетические алгоритмы, деревья решений, экспертные системы. Во второй, практической части, изучаются особенности, этапы и технологии применения этих методов при создании информационно-аналитических систем, в том числе на языке проuраммирования Python.
Цель освоения дисциплины
- Основными целями и результатами освоения дисциплины «Прикладные методы анализа данных при создании информационно-аналитических систем» являются: • Развитие и закрепление практических навыков в построении аналитических и информационных систем управления, включающих интеллектуальную обработку данных. • Систематизация знаний студентов о применении различных изученных статистических, математических методов анализа данных по изученным дисциплинам в рамках направления подготовки магистра 09.04.01 «Информатика и вычислительная техника» по образовательной программе «Компьютерные системы и сети»,в Департаменте компьютерной инженерии МИЭМ им. А.Н.Тихонова НИУ ВШЭ. • Приобретение студентами навыка разработки, построения и сопровождения корпоративных обучаемых экспертных систем, используемых для поддержки принятия решений.
Планируемые результаты обучения
- Знает специфику зависимой переменной в модели бинарной логистической регрессии
- Знает основные особенности и ограничения в использовании статистики выборочных обследований
- Использует байесовские подходы к анализу данных. Применяет алгоритм Random Forest.
- Знание основных методов предобработки данных
- Знает основные типы данных, этапы предобработки данных, методы разведочного анализа данных
- Владеет методами анализа: линейная регрессия, регрессионные деревья, случайный лес
- Знает основные виды искусственных нейронных сетей, способы их обучения.
- Анализирует статистические методы и модели, применение линейной и логистической регрессионных моделей, кластерного и факторного анализа, методов дерева решений для решения экономических задач и поддержки принятия решений.
- Понимать принципы визуализация данных и построения эффективных панелей индикаторов
- Изучить метод Монте-Карло, его достоинства и недостатки.
- Владеет понятием логистической регрессии. Знает метод опорных векторов (SVM). Владеет понятием трюка с ядрами. Знает метод ближайших соседей. Владеет понятием классификационных деревьев.
- Сравнивать задачи классификации и задачи регрессии. Иллюстрировать задачи классификации (бинарной и множественной). Сравнивать наиболее известные классификаторы (логистическая регрессия, деревья решений, случайный лес, метод опорных векторов).
- Понятия интеллектуального анализа данных, обзор задач интеллектуального анализа; упрощенный алгоритм Байеса, деревья решений, алгоритмы кластеризации.
- Корректно применяет ансамбли моделей Random Forest и Gradient Boosting в машинном обучении
- Умеет строить модель логистической регрессии и проводить ее диагностику
- Выполняет предобработку данных. Строит регрессионные и тематические модели. Объясняет основные понятия машинного обучения.
- Интерпретировать коэффициенты логистической регрессии и предельные эффекты
- Знать и уметь применять Метод Монте-Карло
- Уметь специфицировать и оценить модель логистической регрессии.
Содержание учебной дисциплины
- Особенности применения статистических и математических методов моделирования аналитических ИС
- Построение математических моделей и проверка адекватности результатов моделирования при разработке ИАС
- Основы использования ML при построении автоматизированных ИС для решения прикладных задач с помощью методов машинного обучения
- Метод Монте-Карло, прогнозирование и экспорт результатов в ИАС
Элементы контроля
- Активность на семинареПреподаватель оценивает участие студентов на практических занятиях: активность студентов на практических занятиях в дискуссиях и обсуждениях, полноту раскрытия выбранных тем при выступлении с докладами по итогам индивидуальных письменных исследовательских работ, оформление индивидуальных письменных исследовательских работы и презентаций. На семинарских занятиях предусмотрено онлайн тестирование по пройденному материалу, на 10-15 минут.
- Самостоятельная исследовательская работаИндивидуальная письменная исследовательская работа и Доклад по ее результатам с презентацией. Подготовка индивидуальных письменных исследовательских работ (отчетов), посвященных решению практической задачи аналитической обработки данных, которые сдаются студентом в итоговом виде в конце модуля, по одной работе на каждый модуль.
- ЭкзаменЭкзамен в конце второго модуля проходит в письменной форме. Студент решает теоретические и практические задачи в течение 1 ч 20 минут, оценка выставляется по 10-балльной шкале.
Промежуточная аттестация
- 2023/2024 учебный год 2 модуль0.3 * Активность на семинаре + 0.3 * Самостоятельная исследовательская работа + 0.4 * Экзамен
Список литературы
Рекомендуемая основная литература
- 40 алгоритмов, которые должен знать каждый программист на Python. - 978-5-4461-1908-0 - Ахмад Имран - 2023 - Санкт-Петербург: Питер - https://ibooks.ru/bookshelf/390129 - 390129 - iBOOKS
- Derivatives analytics with Python : data analysis, models, simulation, calibration and hedging, Hilpisch, Y. J., 2015
- Machine Learning in R: Random Forest for Cybersport and iGaming. (2019). https://doi.org/10.5281/zenodo.2572680
- Richert, W., & Coelho, L. P. (2013). Building Machine Learning Systems with Python. Birmingham: Packt Publishing. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=619996
- Барский, А. Б. Введение в нейронные сети : учебное пособие / А. Б. Барский. — 2-е изд. — Москва : ИНТУИТ, 2016. — 358 с. — Текст : электронный // Лань : электронно-библиотечная система. — URL: https://e.lanbook.com/book/100684 (дата обращения: 00.00.0000). — Режим доступа: для авториз. пользователей.
- Боев, В. Д. Имитационное моделирование систем : учебное пособие для вузов / В. Д. Боев. — Москва : Издательство Юрайт, 2023. — 253 с. — (Высшее образование). — ISBN 978-5-534-04734-9. — Текст : электронный // Образовательная платформа Юрайт [сайт]. — URL: https://urait.ru/bcode/514932 (дата обращения: 27.08.2024).
- Бутусов Олег Борисович, Butusov Oleg Borisovich, Джулай Анна Алексеевна, & Dzhulai Anna Alekseevna. (2018). Применение методов визуального моделирования и программирования в образовательном процессе по дисциплине «Нейронные сети». Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsbas&AN=edsbas.E28243B
- Войтов, А. Г. Наглядность, визуалистика, инфографика системного анализа : учебное пособие / А. Г. Войтов. - 7-е изд. - Москва : Дашков и К, 2022. - 212 с. - ISBN 978-5-394-05090-9. - Текст : электронный. - URL: https://znanium.com/catalog/product/1926412
- Вьюненко, Л. Ф. Имитационное моделирование : учебник и практикум для вузов / Л. Ф. Вьюненко, М. В. Михайлов, Т. Н. Первозванская ; под редакцией Л. Ф. Вьюненко. — Москва : Издательство Юрайт, 2022. — 283 с. — (Высшее образование). — ISBN 978-5-534-01098-5. — Текст : электронный // Образовательная платформа Юрайт [сайт]. — URL: https://urait.ru/bcode/489074 (дата обращения: 27.08.2024).
- Демидова, О. А. Эконометрика : учебник и практикум для вузов / О. А. Демидова, Д. И. Малахов. — Москва : Издательство Юрайт, 2023. — 334 с. — (Высшее образование). — ISBN 978-5-534-00625-4. — Текст : электронный // Образовательная платформа Юрайт [сайт]. — URL: https://urait.ru/bcode/511223 (дата обращения: 27.08.2024).
- Имитационное моделирование : учебное пособие, Строгалев, В. П., 2015
- Искусственные нейронные сети : теория и практика, Круглов, В. В., 2002
- Коэльо, Л. П. Построение систем машинного обучения на языке Python / Л. П. Коэльо, В. Ричарт , перевод с английского А. А. Слинкин. — 2-е изд. — Москва : ДМК Пресс, 2016. — 302 с. — ISBN 978-5-97060-330-7. — Текст : электронный // Лань : электронно-библиотечная система. — URL: https://e.lanbook.com/book/82818 (дата обращения: 00.00.0000). — Режим доступа: для авториз. пользователей.
- Методы машинного обучения в Data Mining пакета STATISTICA : учебное пособие для вузов, Халафян, А. А., 2022
- Нейронные сети для обработки информации, Осовский, С., 2004
- Нейронные сети. Полный курс : пер. с англ., Хайкин, С., 2018
- Основы машинного обучения - Лимановская О.В., Алферьева Т.И. - ФЛИНТА - 2022 - https://znanium.com/catalog/product/1891377 - 957065 - ZNANIUM
- Практикум по эконометрике : учеб. пособие, Демидова, О. А., 2010
- Практическая бизнес - статистика, Сигел, Э. Ф., 2004
- Рашка, С. Python и машинное обучение: крайне необходимое пособие по новейшей предсказательной аналитике, обязательное для более глубокого понимания методологии машинного обучения : руководство / С. Рашка , перевод с английского А. В. Логунова. — Москва : ДМК Пресс, 2017. — 418 с. — ISBN 978-5-97060-409-0. — Текст : электронный // Лань : электронно-библиотечная система. — URL: https://e.lanbook.com/book/100905 (дата обращения: 00.00.0000). — Режим доступа: для авториз. пользователей.
- Ростовцев, В. С. Искусственные нейронные сети / В. С. Ростовцев. — 3-е изд., стер. — Санкт-Петербург : Лань, 2023. — 216 с. — ISBN 978-5-507-46446-3. — Текст : электронный // Лань : электронно-библиотечная система. — URL: https://e.lanbook.com/book/310184 (дата обращения: 00.00.0000). — Режим доступа: для авториз. пользователей.
- Соробин, А. Б. Сверточные нейронные сети: примеры реализаций : учебно-методическое пособие / А. Б. Соробин. — Москва : РТУ МИРЭА, 2020. — 159 с. — Текст : электронный // Лань : электронно-библиотечная система. — URL: https://e.lanbook.com/book/163853 (дата обращения: 00.00.0000). — Режим доступа: для авториз. пользователей.
- Эконометрика. Начальный курс, учебник, 8-е изд., 504 с., Магнус, Я. Р., Катышев, П. К., Пересецкий, А. А., 2007
Рекомендуемая дополнительная литература
- Имитационное моделирование : теория и технологии, Рыжиков, Ю. И., 2004