Мы используем файлы cookies для улучшения работы сайта НИУ ВШЭ и большего удобства его использования. Более подробную информацию об использовании файлов cookies можно найти здесь, наши правила обработки персональных данных – здесь. Продолжая пользоваться сайтом, вы подтверждаете, что были проинформированы об использовании файлов cookies сайтом НИУ ВШЭ и согласны с нашими правилами обработки персональных данных. Вы можете отключить файлы cookies в настройках Вашего браузера.

  • A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Поиск векторных представлений вершин в задачах машинного обучения на графах

ФИО студента: Славнов Константин Анатольевич

Руководитель: Панов Максим Евгеньевич

Кампус/факультет: Факультет компьютерных наук

Программа: Математические методы оптимизации и стохастики (Магистратура)

Оценка: 10

Год защиты: 2017

В данной работе рассмотрена проблема поиска векторных представлений вершин в задачах машинного обучения на графах и методы ее решения. Задача рассматривается как универсальный метод обработки графовых данных не требующий обучения с учителем. В начале работы мы описываем проблему и ее актуальность. Кратко описываются подходы основанные на матричной факторизации или случайных блужданиях для решения данной задачи. После чего мотивируется идея создания новых алгоритмов и кратко описывается их концепция. Один метод основан на структурной функции потерь, второй разработан на основе матричной факторизации. После введения и формальной постановки задачи мы переходим к описанию современных методов для дальнейшего анализа и сравнения с новыми, а именно методы матричной факторизации: SVD, NMF, BigClam и случайного блуждания: DeepWalk, Node2vec. Представляются новые методы: Sparse Gamma Model и структурная плотностная функция потерь. После того, как все рассматриваемые в работе методы описаны, приводятся свойства, желательные для алгоритмов по поиску векторных представлений. Приведем краткий перечень таких свойств. Метод должен быть универсальным для всех задач на графах. Масштабируемый метод. Метод без параметров. Метод не использует сложных предположений о природе данных. Метод напрямую использует структуру графа. Автоматический подбор эффективной размерности вложения. Все методы разбираются по представленным критериям, проводится сравнительный анализ. Структурная плотностная функция потерь удовлетворяет всем перечисленным свойствам. Работа завершается экспериментами и выводами. В ходе экспериментов были рассмотрены модельный и реальный пример в задаче классификации на графах. Структурная плотностная функция потерь показала себя на том же уровне, что и лучшие методы. Отдельное внимание уделено задачи выделения пересекающихся сообществ, в которой Sparse Gamma Model проявила себя как лучшая модель.

Текст работы (работа добавлена 6 июня 2017 г.)

Выпускные квалификационные работы (ВКР) в НИУ ВШЭ выполняют все студенты в соответствии с университетским Положением и Правилами, определенными каждой образовательной программой.

Аннотации всех ВКР в обязательном порядке публикуются в свободном доступе на корпоративном портале НИУ ВШЭ.

Полный текст ВКР размещается в свободном доступе на портале НИУ ВШЭ только при наличии согласия студента – автора (правообладателя) работы либо, в случае выполнения работы коллективом студентов, при наличии согласия всех соавторов (правообладателей) работы. ВКР после размещения на портале НИУ ВШЭ приобретает статус электронной публикации.

ВКР являются объектами авторских прав, на их использование распространяются ограничения, предусмотренные законодательством Российской Федерации об интеллектуальной собственности.

В случае использования ВКР, в том числе путем цитирования, указание имени автора и источника заимствования обязательно.

Реестр дипломов НИУ ВШЭ