• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта
Магистратура 2022/2023

Веб-поиск и ранжирование

Лучший по критерию «Полезность курса для расширения кругозора и разностороннего развития»
Лучший по критерию «Новизна полученных знаний»
Статус: Курс обязательный (Машинное обучение и анализ данных)
Направление: 01.04.02. Прикладная математика и информатика
Когда читается: 2-й курс, 1-3 модуль
Формат изучения: без онлайн-курса
Охват аудитории: для своего кампуса
Преподаватели: Зиновьев Алексей Викторович, Зубаков Алексей Васильевич, Свидченко Олег Анатольевич
Прогр. обучения: Машинное обучение и анализ данных
Язык: русский
Кредиты: 8
Контактные часы: 80

Программа дисциплины

Аннотация

Дисциплина направлена на формирование у студентов теоретических знаний и практических навыков веб-поиска и ранжирования данных. Студенты получат знания об основных алгоритмах веб-поиска, создадут собственный веб-краулер и проведут оценку качества собранных результатов. Для освоения дисциплины студентам необходимы знания, полученные в результате изучения дисциплин «Машинное обучение», «Теория вероятностей и математическая статистика».
Цель освоения дисциплины

Цель освоения дисциплины

  • Формирование у студентов теоретических знаний и практических навыков веб-поиска и ранжирования данных.
Планируемые результаты обучения

Планируемые результаты обучения

  • Знает технологии оценки качества поиска
  • Умеет собирать данные из веб-ресурсов
  • Имеет навыки использования прямых методов ранжирования и способов проведения ранжирования с использованием машинного обучения.
Содержание учебной дисциплины

Содержание учебной дисциплины

  • Раздел 1. Оценка качества информационного поиска
  • Раздел 2. Подготовка данных для поиска, обработка запроса
  • Раздел 3. Классические подходы к ранжированию, применение семантических методов и машинного обучения
  • Раздел 4. Федеративный поиск, кликовые модели
Элементы контроля

Элементы контроля

  • неблокирующий Проект
    В качестве курсового проекта обучающиеся должны будут реализовать проект, использующий современные методы веб-поиска и ранжирования для решения прикладной задачи.
  • блокирующий Экзамен
    Устный экзамен проводится в форме ответов на вопросы экзаменационного билета. Экзаменационный билет содержит два вопроса из перечня вопросов к экзамену. На подготовку ответа выделяется 2,5 часа.
  • неблокирующий Защита работы
    Элемент контроля проводится в устной форме и состоит из 3-х частей: презентация научной статьи по теме Information Retrieval (SIGIR, WSDM, CIKM), ответ по случайному вопросу из списка и решение задачи.
Промежуточная аттестация

Промежуточная аттестация

  • 2022/2023 учебный год 1 модуль
    0.5 * Защита работы + 0.5 * Проект
  • 2022/2023 учебный год 2 модуль
    0.5 * Проект + 0.5 * Защита работы
  • 2022/2023 учебный год 3 модуль
    0.5 * Проект + 0.5 * Экзамен
Список литературы

Список литературы

Рекомендуемая основная литература

  • Gossen, T. (2015). Search Engines for Children : Search User Interfaces and Information-Seeking Behaviour. Wiesbaden: Springer Vieweg. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=1159664
  • Sándor Dominich. The Modern Algebra of Information Retrieval (2008), Springer

Рекомендуемая дополнительная литература

  • Hwee Tou Ng, Mun-Kew Leong, Min-Yen Kan, Donghong Ji. Information Retrieval Technology/Third Asia Information Retrieval Symposium, AIRS 2006, Singapore, October 16-18, 2006. Proceedings, 2006, Springer
  • Levene, M. (2010). An Introduction to Search Engines and Web Navigation. Hoboken, N.J.: Wiley. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=335281