Специалитет
2024/2025
Методы обработки и хранения больших данных и машинного обучения
Статус:
Курс по выбору (Компьютерная безопасность)
Кто читает:
Кафедра компьютерной безопасности
Когда читается:
4-й курс, 4 модуль
Формат изучения:
без онлайн-курса
Охват аудитории:
для своего кампуса
Специальность:
10.05.01. Компьютерная безопасность
Язык:
русский
Кредиты:
3
Программа дисциплины
Аннотация
Данная дисциплина относится к блоку дисциплин по выбору вариативной части профиля профессионального цикла, проводится на 4 курсе обучения. Изучение данной дисциплины базируется на следующих дисциплинах: Информатика, Языки программирования, Теория вероятностей и математическая статистика, Методы программирования, Методы анализа данных. Основные положения дисциплины должны быть использованы в дальнейшем при изучении таких дисциплин, как: Моделирование бизнес-процессов, Управление жизненным циклом ИС. Результаты освоения дисциплины используются в дальнейшем при прохождении производственной и преддипломной практик, при выполнении выпускной квалификационной работы.
Цель освоения дисциплины
- Целью освоения дисциплины «Методы обработки и хранения больших данных и машинного обучения» является теоретическая и практическая подготовка студентов к работе с большими массивами данных и методами их обработки. Знания, полученные в результате освоения дисциплины, помогут при сборе и анализе больших объемов структурированной и неструктурированной информации, при разработке моделей данных и получении новых знаний в данной области.
Планируемые результаты обучения
- Знать глобально- распределенные БД, пакетную и потоковую обработки
- Знать задачи распределенных файловых систем, партиционарование, шардирование, разбиение, сегментирование
- Знать основные методики, алгоритмы и библиотеки для полнотекстового поиска в больших данных
- Знать понятия согласованности и линеаризуемости изменений, модели согласованности и алгоритмы консенсуса
- Знать требования приложений к СУБД, строгую предопределенную схему и нормализацию, пути масштабирования и архитектуру разделяемой памяти.
Содержание учебной дисциплины
- Физическое хранение данных, их эволюция
- Колоночные СУБД и репликация данных
- Распределенные системы, алгоритмы консенсуса
- Глобально-распределенная БД. Пакетная обработка
- Анализ текста
Список литературы
Рекомендуемая основная литература
- Hurwitz, J., Kaufman, M., Halper, F., & Nugent, A. (2013). Big Data For Dummies. Hoboken, N.J.: For Dummies. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=565511
- Pedrycz, W., & Chen, S.-M. (2017). Data Science and Big Data: An Environment of Computational Intelligence. Cham: Springer. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=1489226
Рекомендуемая дополнительная литература
- Mahmood, Z. (2016). Data Science and Big Data Computing : Frameworks and Methodologies. Switzerland: Springer. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=1203573