• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Вакансии с портала HeadHunter

ФИО студента: Кирюшкин Никита Игоревич

Руководитель: Кантонистова Елена Олеговна

Кампус/факультет: Факультет компьютерных наук

Программа: Машинное обучение и высоконагруженные системы (Магистратура)

Оценка: 7

Год защиты: 2024

Целью данной работы является разработка модели, позволяющей предсказать заработную плату по описанию вакансии. Проект состоит из следующих этапов: постановка задачи, сбор данных, их предобработка, создание модели и реализация сервиса. В качестве источника данных был использован агрегатор Head Hunter, предоставляющий свой API для парсинга характеризующих вакансии сведений. Сформированный датасет состоит из 300000 вакансий, размещенных в 2021 году. Ко всем характеристикам применены соответствующие методы предобработки в зависимости от типа данных, вида представления, распределения значений и т. д. В работе представлены этапы предварительной обработки для подготовки данных к использованию в различных моделях. Для решения задачи разработан ряд моделей машинного обучения разных архитектур и на основе нескольких наборов признаков. Значения выбранных метрик разработанного алгоритма по сравнению с метриками созданного в качестве бейзлайна аналитического решения демонстрируют важность используемых моделью признаков и её общую обобщающую способность. С использованием лучшей модели создан сервис на основе бота telegram, позволяющий по ссылке на вакансию на портале Head Hunter предсказывать заработную плату. Для этого воспроизводится весь пайплайн, описанный ранее: сбор данных с портала Head Hunter, предобработка признаков и применение модели. Описанный интерфейс позволяет реализовать инференс модели на новых вакансиях.

Текст работы (работа добавлена 29 мая 2024 г.)

Выпускные квалификационные работы (ВКР) в НИУ ВШЭ выполняют все студенты в соответствии с университетским Положением и Правилами, определенными каждой образовательной программой.

Аннотации всех ВКР в обязательном порядке публикуются в свободном доступе на корпоративном портале НИУ ВШЭ.

Полный текст ВКР размещается в свободном доступе на портале НИУ ВШЭ только при наличии согласия студента – автора (правообладателя) работы либо, в случае выполнения работы коллективом студентов, при наличии согласия всех соавторов (правообладателей) работы. ВКР после размещения на портале НИУ ВШЭ приобретает статус электронной публикации.

ВКР являются объектами авторских прав, на их использование распространяются ограничения, предусмотренные законодательством Российской Федерации об интеллектуальной собственности.

В случае использования ВКР, в том числе путем цитирования, указание имени автора и источника заимствования обязательно.

Реестр дипломов НИУ ВШЭ