• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Применение методов машинного обучения для определения оптимальных точек продаж табачной продукции для малого и среднего бизнеса

ФИО студента: Дементьев Иван Алексеевич

Руководитель: Бурова Маргарита Борисовна

Кампус/факультет: Факультет компьютерных наук

Программа: Магистр по наукам о данных (Магистратура)

Год защиты: 2024

В диссертации представлен пошаговый процесс создания готового к использованию сервиса для прогнозирования продаж в новых точках розничной торговли табачными изделиями в Москве. Сервис основан на методах машинного обучения, применяемых к данным государственной системы маркировки «Честный знак». Разработка сервиса включает четыре ключевых этапа: сбор и анализ данных о маркировке, парсинг необходимых характеристик и справочников, обучение моделей машинного обучения и запуск Telegram-бота. Первый этап - сбор и анализ данных - предполагает подключение к базам данных системы маркировки, извлечение данных (более 7 миллиардов записей), статистический и экспертный анализ этих данных, выявление зависимостей и аномалий, а также агрегирование данных для оптимизации процессов машинного обучения. Второй этап, парсинг характеристик, осуществляется через открытые сервисы и включает анализ геоданных, таких как количество зданий различных типов вокруг торговой точки, расстояния до станций метро и конкурентов. Этот этап является наиболее сложным и ресурсоемким, поэтому данная работа ограничена одним городом - Москвой, и одним форматом - табачной лавкой. Третий этап - обучение моделей машинного обучения - предполагает применение различных методов, таких как линейная регрессия, деревья решений и ансамбли моделей (Random Forest, Gradient Boosting, XGBoost). Основной метрикой успеха является MAPE, который составил 0,46, что является лучшим результатом среди существующих аналогов. Последний этап - разработка финального интерфейса - реализован в виде бота Telegram, выбранного за его популярность среди пользователей, простоту разработки и удобство использования. Данный подход демонстрирует, как современные технологии машинного обучения могут эффективно применяться для решения практических задач в сфере розничной торговли. Таким образом, представленная работа демонстрирует, как современные технологии машинного обучения могут быть эффективно использованы для решения актуальных коммерческих задач в сфере розничной торговли. В перспективе планируется распространить сервис на другие регионы и типы торговых точек, включая сетевые и продуктовые магазины, а также алкогольные рынки.

Выпускные квалификационные работы (ВКР) в НИУ ВШЭ выполняют все студенты в соответствии с университетским Положением и Правилами, определенными каждой образовательной программой.

Аннотации всех ВКР в обязательном порядке публикуются в свободном доступе на корпоративном портале НИУ ВШЭ.

Полный текст ВКР размещается в свободном доступе на портале НИУ ВШЭ только при наличии согласия студента – автора (правообладателя) работы либо, в случае выполнения работы коллективом студентов, при наличии согласия всех соавторов (правообладателей) работы. ВКР после размещения на портале НИУ ВШЭ приобретает статус электронной публикации.

ВКР являются объектами авторских прав, на их использование распространяются ограничения, предусмотренные законодательством Российской Федерации об интеллектуальной собственности.

В случае использования ВКР, в том числе путем цитирования, указание имени автора и источника заимствования обязательно.

Реестр дипломов НИУ ВШЭ