2023/2024
Машинное обучение и анализ больших данных
Лучший по критерию «Полезность курса для расширения кругозора и разностороннего развития»
Статус:
Маго-лего
Кто читает:
Департамент бизнес-информатики
Когда читается:
2 модуль
Онлайн-часы:
20
Охват аудитории:
для своего кампуса
Преподаватели:
Бекларян Армен Левонович
Язык:
русский
Кредиты:
3
Контактные часы:
24
Программа дисциплины
Аннотация
Настоящая дисциплина относится к вариативной части дисциплин программы "Управление цифровым продуктом" и направлен на формирование комплексного понимания современных технологий искусственного интеллекта и их практического применения в бизнесе.В рамках курса студенты познакомятся с ключевыми концепциями машинного обучения и глубокого обучения, освоят принципы работы с данными в ИИ-проектах, изучат классические и современные методы машинного обучения. Особое внимание уделяется практическим аспектам применения технологий искусственного интеллекта в бизнес-контексте.Курс сочетает теоретическую подготовку с практическим освоением инструментов и методов управления AI-проектами. Студенты научатся оценивать эффективность ИИ-решений и принимать обоснованные решения при внедрении технологий искусственного интеллекта в бизнес-среде.
Цель освоения дисциплины
- Целью освоения дисциплины "Машинное обучение и анализ больших данных" является обучение студентов базовым навыкам использования машинного обучения и анализа данных и пониманию принципов реализации проектов, использующих технологии машинного обучения и ИИ при создании и развитии цифровых продуктов.
Планируемые результаты обучения
- Объясняет основы математики для анализа данных
- Формулирует основные постановки задач и типы данных в машинном обучении
- Применяет методы и модели решающих деревьев, простых нейронных сетей, xgboost, метода опорных векторов и демонстрирует навык их обучения
- Описывает основные концепции и методы машинного обучения, применяемые при решении классификационных и регрессионных задач
- Применяет методы кластеризации данных, сингулярного разложения, фактор-анализа, главных компонент
- Объясняет основные подходы к построению моделей обучения с подкреплением
- Описывает основные концепции нейронных сетей и методы их обучения в задачах анализа неструктурированных данных
- Применяет основные используемые методы обработки текстов, изображений и видео
- Оценивает применимости ИИ и ML-технологий для решения конкретных бизнес-задач.
- Формулирует требования к данным для ИИ и ML-проектов.
- Разрабатывает стратегии сбора и подготовки данных для машинного обучения.
- Выбирает оптимальные методы и алгоритмы машинного обучения под специфику задачи.
- Применяет понимание принципы работы и области применимости классических неглубоких моделей машинного обучения.
- Применяет понимание принципов работы и области применения в бизнес-задачах глубоких моделей машинного обучения при обработке не структурированных данных.
- Применяет понимание принципов и возможности применение методов векторного представления данных для бизнес-задач.
- Применяет понимание принципов обработки текстов на естественном языке с помощью моделей глубокого обучения и больших языковых моделей и области применения этих решений в бизнес-задачах
- Оценивает качество и эффективность ML-моделей.
- Оценивает качество и эффективность моделей глубокого обучения.
- Управляет жизненным циклом ИИ-проекта.
- Применяет принципы формирования команды ИИ-проекта.
Содержание учебной дисциплины
- Основы машинного обучения и больших данных
- Обучение с учителем
- Обучение без учителя
- Неструктурированные данные
Элементы контроля
- ЭкзаменЭкзаменационная работа представляет из себя тест с вопросами закрытого типа. Форма экзамена: Экзамен проводится в письменной форме. Платформа проведения: Экзамен проводится на платформе Canvas LMS. Для участия в экзамене студент обязан: Не позднее 7 дней до проведения экзамена проверить работоспособность компьютерного оборудования, необходимого для сдачи экзамена и убедиться в соответствие имеющегося оборудования требованиям к компьютеру для участия в экзамене на платформе Canvas LMS; Войти на платформу Canvas LMS под личной учетной записью (используется аккаунт студента @edu.hse.ru); Перед началом экзамена проверить скорость работы сети Интернет (для наилучшего результата рекомендуется подключение компьютера к сети через кабель); Подготовить необходимые для проведения экзамена инструменты: ручка, листы бумаги, калькулятор и т. д.; Отключить в диспетчере задач компьютера иные приложения, кроме браузера, в котором будет выполняться вход на платформу Canvas LMS. В случае, если одно из необходимых условий участия в экзамене невозможно выполнить, необходимо за 2 недели до даты проведения экзамена проинформировать об этом преподавателя или сотрудника учебного офиса для принятия решения об участии студента в экзаменах. Во время экзамена студентам запрещено: Пользоваться конспектами, учебниками, прочими учебными материалами; Покидать место выполнения экзаменационного задания; Пользоваться умными гаджетами (смартфон, планшет и др.); Привлекать посторонних лиц для помощи в проведении экзамена, разговаривать с посторонними во время выполнения заданий; Вслух громко зачитывать задания. Во время экзамена студентам разрешено: Использовать бумагу, ручку для ведения записей, расчетов; Использовать калькулятор для ведения расчетов; Запрашивать у преподавателя дополнительную информацию, связанную с выполнением экзаменационного задания; Взаимодействовать с другими студентами по разрешению преподавателя. В случае долговременного нарушения связи с платформами MS Teams и Canvas LMS во время выполнения экзаменационного задания, студент должен уведомить об этом преподавателя, зафиксировать факт потери связи с платформой (скриншот, ответ от провайдера сети Интернет) и обратиться в учебный офис с объяснительной запиской о случившемся для принятия решения о пересдаче экзамена
- Групповой проектВыполнение группового проекта предусматривает построение моделей анализа реальных данных, выявление регулярных выражений, построение аналитических срезов и фильтров, выделение корреляций между срезами, отображение взаимосвязей и визуализацию итогов анализа в BI системе
- Аудиторная работа
Промежуточная аттестация
- 2023/2024 учебный год 2 модуль0.1 * Аудиторная работа + 0.6 * Групповой проект + 0.3 * Экзамен
Список литературы
Рекомендуемая основная литература
- 9781838820046 - Lapan, Maxim - Deep Reinforcement Learning Hands-On : Apply Modern RL Methods to Practical Problems of Chatbots, Robotics, Discrete Optimization, Web Automation, and More, 2nd Edition - 2020 - Packt Publishing - http://search.ebscohost.com/login.aspx?direct=true&db=nlebk&AN=2366458 - nlebk - 2366458
- Aman Kedia, & Mayank Rasu. (2020). Hands-On Python Natural Language Processing : Explore Tools and Techniques to Analyze and Process Text with a View to Building Real-world NLP Applications. Packt Publishing.
- Dipanjan Sarkar. (2019). Text Analytics with Python : A Practitioner’s Guide to Natural Language Processing: Vol. Second edition. Apress.
- Yang, X.-S. (2019). Introduction to Algorithms for Data Mining and Machine Learning. Academic Press.
- Маккинни, У. Python и анализ данных / У. Маккинни , перевод с английского А. А. Слинкина. — 2-ое изд., испр. и доп. — Москва : ДМК Пресс, 2020. — 540 с. — ISBN 978-5-97060-590-5. — Текст : электронный // Лань : электронно-библиотечная система. — URL: https://e.lanbook.com/book/131721 (дата обращения: 00.00.0000). — Режим доступа: для авториз. пользователей.
- Рашка, С. Python и машинное обучение: крайне необходимое пособие по новейшей предсказательной аналитике, обязательное для более глубокого понимания методологии машинного обучения : руководство / С. Рашка , перевод с английского А. В. Логунова. — Москва : ДМК Пресс, 2017. — 418 с. — ISBN 978-5-97060-409-0. — Текст : электронный // Лань : электронно-библиотечная система. — URL: https://e.lanbook.com/book/100905 (дата обращения: 00.00.0000). — Режим доступа: для авториз. пользователей.
Рекомендуемая дополнительная литература
- 9781789958294 - Raschka, Sebastian; Mirjalili, Vahid - Python Machine Learning : Machine Learning and Deep Learning with Python, Scikit-learn, and TensorFlow 2, 3rd Edition - 2019 - Packt Publishing - http://search.ebscohost.com/login.aspx?direct=true&db=nlebk&AN=2329991 - nlebk - 2329991
- Aurélien Géron. (2019). Hands-On Machine Learning with Scikit-Learn, Keras, and TensorFlow : Concepts, Tools, and Techniques to Build Intelligent Systems: Vol. Second edition. O’Reilly Media.
- Nandy, A., & Biswas, M. (2018). Reinforcement Learning : With Open AI, TensorFlow and Keras Using Python. [Berkeley, CA]: Apress. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=1651811
- Python для сложных задач: наука о данных и машинное обучение - 978-5-496-03068-7 - Плас Дж. Вандер - 2018 - Санкт-Петербург: Питер - https://ibooks.ru/bookshelf/356721 - 356721 - iBOOKS
- Wei-Meng Lee. 2019. Python Machine Learning. John Wiley & Sons, Incorporated
- Шарден, Б. Крупномасштабное машинное обучение вместе с Python : учебное пособие / Б. Шарден, Л. Массарон, А. Боскетти , перевод с английского А. В. Логунова. — Москва : ДМК Пресс, 2018. — 358 с. — ISBN 978-5-97060-506-6. — Текст : электронный // Лань : электронно-библиотечная система. — URL: https://e.lanbook.com/book/105836 (дата обращения: 00.00.0000). — Режим доступа: для авториз. пользователей.