• A
  • A
  • A
  • ABC
  • ABC
  • ABC
  • А
  • А
  • А
  • А
  • А
Regular version of the site

Machine Leaning and System Security

2024/2025
Academic Year
RUS
Instruction in Russian
Delivered at:
Department of Cyber-Physical Systems Information Security
Course type:
Compulsory course
When:
1 year, 3, 4 module

Instructor


Андреева Дарья Александровна

Программа дисциплины

Аннотация

Курс посвящен изучению современных методов машинного обучения (ML) и основ безопасности искусственного интеллекта (AI Safety). Студенты познакомятся с ключевыми идеями и алгоритмами ML, а также с теоретическими и практическими аспектами обеспечения безопасности и надежности AI-систем. В рамках курса будут рассмотрены вопросы управления системами и рисками, связанные с ними, а также обнаружение уязвимостей, интерпретируемость моделей и поддержание систем, использующих AI.
Цель освоения дисциплины

Цель освоения дисциплины

  • Ознакомление с основными методами эксплоративного анализа данных.
  • Формирование навыков разработки систем машинного обучения.
  • Формирование навыков исследования систем машинного обучения с точки зрения бизнеса и науки.
Планируемые результаты обучения

Планируемые результаты обучения

  • Определяет основные понятия и задачи машинного обучения
  • Различает виды задач и понимает, где нужно какую использовать
  • Определяет цели и задачи эксплоративного анализа данных
  • Выполняет предварительную обработку данных (очистка, трансформация, устранение пропусков)
  • Проводит визуализацию данных для выявления закономерностей и аномалий
  • Применяет методы описательной статистики для анализа распределений и взаимосвязей
  • Интерпретирует результаты эксплоративного анализа данных и формулирует гипотезы
  • Оценивает параметры линейной регрессии методом наименьших квадратов
  • Анализирует качество линейных моделей с использованием метрик (MAE, MSE, R²)
  • Корректно подбирает метрику под решаемую задачу
  • Проводит регуляризацию линейных моделей (Ridge, Lasso) для предотвращения переобучения и понимает, зачем это нужно
  • Интерпретирует параметры линейных моделей и их значимость
  • Обучает решающие деревья на основе критерия разбиения (Gini, энтропия, MSE)
  • Выполняет настройку гиперпараметров решающих деревьев (глубина, минимальное число объектов в узле)
  • Анализирует переобучение и недообучение решающих деревьев
  • Интерпретирует структуру дерева решений и значимость признаков
  • Создаёт архитектуру нейронной сети (полносвязные, сверточные, рекуррентные слои и т.д.) и понимает, для чего используется каждая
  • Выполняет настройку гиперпараметров нейронной сети (число слоёв, нейронов, скорость обучения)
  • Обучает нейронные сети с использованием оптимизаторов (SGD, Adam) и функций потерь
  • Применяет модели векторного представления текста (TF-IDF, word2vec, BERT)
  • Решает задачи классификации, кластеризации и поиска по тексту
  • Понимает, для чего используется каждая модель и интерпретирует результаты
  • Выполняет предварительную обработку изображений (нормализация, масштабирование, аугментация)
  • Применяет свёрточные нейронные сети (CNN) для извлечения признаков и классификации изображений
  • Решает задачи сегментации, распознавания объектов и восстановления изображений
  • Анализирует вклад признаков с помощью методов интерпретации (SHAP, LIME)
  • Использует упрощённые модели (линейные модели, деревья решений) для интерпретации сложных моделей
  • Визуализирует важность признаков и влияние отдельных переменных на прогноз
  • Оценивает устойчивость моделей к выбросам, шуму и изменениям в данных
  • Проводит атаки на модели (adversarial attacks) для выявления уязвимостей
  • Применяет методы повышения робастности (дополнительные регуляризации, adversarial training)
Содержание учебной дисциплины

Содержание учебной дисциплины

  • 1. Введение в дисциплину
  • 2. Эксплоративный анализ данных
  • 3. Линейные модели
  • 4. Решающие деревья
  • 5. Нейронные сети
  • 6. Анализ текстов
  • 7. Работа с изображениями
  • 8. Интерпретируемость моделей
  • 9. Робастность моделей и уязвимости
Элементы контроля

Элементы контроля

  • неблокирующий Опрос на занятиях
  • неблокирующий Практические работы
  • неблокирующий Контрольные работы
  • неблокирующий Экзамен
    Итоговый экзамен по дисциплине проводится в форме пиьсменного экзамена в конце изучения курса в присутствии преподавателя. На экзамене студент получает формуляр с заданиями экзамена, которые должен решить и сдать на проверку в течение 2 (двух) академических часов.
Промежуточная аттестация

Промежуточная аттестация

  • 2024/2025 4th module
    0.15 * Контрольные работы + 0.15 * Опрос на занятиях + 0.4 * Практические работы + 0.3 * Экзамен
Список литературы

Список литературы

Рекомендуемая основная литература

  • Christopher M. Bishop. (n.d.). Australian National University Pattern Recognition and Machine Learning. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsbas&AN=edsbas.EBA0C705
  • Hastie, T., Tibshirani, R., & Friedman, J. H. (2009). The Elements of Statistical Learning : Data Mining, Inference, and Prediction (Vol. Second edition, corrected 7th printing). New York: Springer. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=277008
  • Manning C. D., Schutze H. Foundations of statistical natural processing. – 1999. – 719 pp.

Рекомендуемая дополнительная литература

  • Stephen Boyd, Lieven Vandenberghe, & Lieven V. (2015). Additional Exercises for Convex Optimization. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsbas&AN=edsbas.E7445CE1

Авторы

  • Евсютин Олег Олегович
  • Андреева Дарья Александровна
  • Аксенова Ольга Вениаминовна