Магистратура
2022/2023





Веб-поиск и ранжирование
Лучший по критерию «Полезность курса для расширения кругозора и разностороннего развития»
Лучший по критерию «Новизна полученных знаний»
Статус:
Курс обязательный (Машинное обучение и анализ данных)
Направление:
01.04.02. Прикладная математика и информатика
Кто читает:
Департамент информатики
Где читается:
Школа информатики, физики и технологий
Когда читается:
2-й курс, 1-3 модуль
Формат изучения:
без онлайн-курса
Охват аудитории:
для своего кампуса
Прогр. обучения:
Машинное обучение и анализ данных
Язык:
русский
Кредиты:
8
Контактные часы:
80
Программа дисциплины
Аннотация
Дисциплина направлена на формирование у студентов теоретических знаний и практических навыков веб-поиска и ранжирования данных. Студенты получат знания об основных алгоритмах веб-поиска, создадут собственный веб-краулер и проведут оценку качества собранных результатов. Для освоения дисциплины студентам необходимы знания, полученные в результате изучения дисциплин «Машинное обучение», «Теория вероятностей и математическая статистика».
Цель освоения дисциплины
- Формирование у студентов теоретических знаний и практических навыков веб-поиска и ранжирования данных.
Планируемые результаты обучения
- Знает технологии оценки качества поиска
- Умеет собирать данные из веб-ресурсов
- Имеет навыки использования прямых методов ранжирования и способов проведения ранжирования с использованием машинного обучения.
Содержание учебной дисциплины
- Раздел 1. Оценка качества информационного поиска
- Раздел 2. Подготовка данных для поиска, обработка запроса
- Раздел 3. Классические подходы к ранжированию, применение семантических методов и машинного обучения
- Раздел 4. Федеративный поиск, кликовые модели
Элементы контроля
- ПроектВ качестве курсового проекта обучающиеся должны будут реализовать проект, использующий современные методы веб-поиска и ранжирования для решения прикладной задачи.
- ЭкзаменУстный экзамен проводится в форме ответов на вопросы экзаменационного билета. Экзаменационный билет содержит два вопроса из перечня вопросов к экзамену. На подготовку ответа выделяется 2,5 часа.
- Защита работыЭлемент контроля проводится в устной форме и состоит из 3-х частей: презентация научной статьи по теме Information Retrieval (SIGIR, WSDM, CIKM), ответ по случайному вопросу из списка и решение задачи.
Промежуточная аттестация
- 2022/2023 учебный год 1 модуль0.5 * Защита работы + 0.5 * Проект
- 2022/2023 учебный год 2 модуль0.5 * Проект + 0.5 * Защита работы
- 2022/2023 учебный год 3 модуль0.5 * Проект + 0.5 * Экзамен
Список литературы
Рекомендуемая основная литература
- Gossen, T. (2015). Search Engines for Children : Search User Interfaces and Information-Seeking Behaviour. Wiesbaden: Springer Vieweg. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=1159664
- Sándor Dominich. The Modern Algebra of Information Retrieval (2008), Springer
Рекомендуемая дополнительная литература
- Hwee Tou Ng, Mun-Kew Leong, Min-Yen Kan, Donghong Ji. Information Retrieval Technology/Third Asia Information Retrieval Symposium, AIRS 2006, Singapore, October 16-18, 2006. Proceedings, 2006, Springer
- Levene, M. (2010). An Introduction to Search Engines and Web Navigation. Hoboken, N.J.: Wiley. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=335281