• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта
Специалитет 2024/2025

Методы обработки и хранения больших данных и машинного обучения

Статус: Курс по выбору (Компьютерная безопасность)
Когда читается: 4-й курс, 4 модуль
Формат изучения: без онлайн-курса
Охват аудитории: для своего кампуса
Специальность: 10.05.01. Компьютерная безопасность
Язык: русский
Кредиты: 3

Программа дисциплины

Аннотация

Данная дисциплина относится к блоку дисциплин по выбору вариативной части профиля профессионального цикла, проводится на 4 курсе обучения. Изучение данной дисциплины базируется на следующих дисциплинах: Информатика, Языки программирования, Теория вероятностей и математическая статистика, Методы программирования, Методы анализа данных. Основные положения дисциплины должны быть использованы в дальнейшем при изучении таких дисциплин, как: Моделирование бизнес-процессов, Управление жизненным циклом ИС. Результаты освоения дисциплины используются в дальнейшем при прохождении производственной и преддипломной практик, при выполнении выпускной квалификационной работы.
Цель освоения дисциплины

Цель освоения дисциплины

  • Целью освоения дисциплины «Методы обработки и хранения больших данных и машинного обучения» является теоретическая и практическая подготовка студентов к работе с большими массивами данных и методами их обработки. Знания, полученные в результате освоения дисциплины, помогут при сборе и анализе больших объемов структурированной и неструктурированной информации, при разработке моделей данных и получении новых знаний в данной области.
Планируемые результаты обучения

Планируемые результаты обучения

  • Знать глобально- распределенные БД, пакетную и потоковую обработки
  • Знать задачи распределенных файловых систем, партиционарование, шардирование, разбиение, сегментирование
  • Знать основные методики, алгоритмы и библиотеки для полнотекстового поиска в больших данных
  • Знать понятия согласованности и линеаризуемости изменений, модели согласованности и алгоритмы консенсуса
  • Знать требования приложений к СУБД, строгую предопределенную схему и нормализацию, пути масштабирования и архитектуру разделяемой памяти.
Содержание учебной дисциплины

Содержание учебной дисциплины

  • Физическое хранение данных, их эволюция
  • Колоночные СУБД и репликация данных
  • Распределенные системы, алгоритмы консенсуса
  • Глобально-распределенная БД. Пакетная обработка
  • Анализ текста
Элементы контроля

Элементы контроля

  • неблокирующий Laboratory work
  • неблокирующий Oral interview
Промежуточная аттестация

Промежуточная аттестация

  • 2024/2025 4th module
    0.5 * Laboratory work + 0.5 * Oral interview
Список литературы

Список литературы

Рекомендуемая основная литература

  • Hurwitz, J., Kaufman, M., Halper, F., & Nugent, A. (2013). Big Data For Dummies. Hoboken, N.J.: For Dummies. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=565511
  • Pedrycz, W., & Chen, S.-M. (2017). Data Science and Big Data: An Environment of Computational Intelligence. Cham: Springer. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=1489226

Рекомендуемая дополнительная литература

  • Mahmood, Z. (2016). Data Science and Big Data Computing : Frameworks and Methodologies. Switzerland: Springer. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=1203573

Авторы

  • Лось Алексей Борисович