Мы используем файлы cookies для улучшения работы сайта НИУ ВШЭ и большего удобства его использования. Более подробную информацию об использовании файлов cookies можно найти здесь, наши правила обработки персональных данных – здесь. Продолжая пользоваться сайтом, вы подтверждаете, что были проинформированы об использовании файлов cookies сайтом НИУ ВШЭ и согласны с нашими правилами обработки персональных данных. Вы можете отключить файлы cookies в настройках Вашего браузера.

  • A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Экспериментальное исследование эффективности алгоритмов поиска ближайших соседей в метрических пространствах при кластеризации объектов

ФИО студента: Кудряшов Евгений Алексеевич

Руководитель: Ульянов Михаил Васильевич

Кампус/факультет: Факультет компьютерных наук

Программа: Программная инженерия (Бакалавриат)

Оценка: 10

Год защиты: 2016

С развитием технологий и экспоненциальным ростом объёмов данных возникает острая проблема кластеризации информации. Ряд алгоритмов кластеризации использует принцип поиска ближайшего соседа, чтобы определить принадлежность элемента к какому-либо кластеру. В работе рассматриваются эффективные по времени алгоритмы поиска ближайших соседей в различных метрических пространствах, их влияние на качество и время кластеризации, а также представлены экспериментальные результаты сравнительного анализа. Исследование проводилось с использованием алгоритма иерархической агломеративной кластеризации, который использует для поиска ближайших соседей алгоритмы, основанные на деревьях и хешировании, совместно с метрическими пространствами Евклида, Кларка, Лоренца и размера Пенроуза. Для экспериментов используется два вида входных данных: сгенерированных случайным образом (обобщенные характеристики временных рядов) и взятых из реальной жизни (показания электромиографа). Работа содержит 57 страниц, 4 главы, 33 рисунка, 4 таблицы, 49 источников, 2 приложения. Ключевые слова: кластеризация, иерархическая кластеризация, поиск ближайших соседей, kd дерево, vp дерево, locality-sensitive hashing, best bin first.

Текст работы (работа добавлена 25 мая 2016 г.)

Выпускные квалификационные работы (ВКР) в НИУ ВШЭ выполняют все студенты в соответствии с университетским Положением и Правилами, определенными каждой образовательной программой.

Аннотации всех ВКР в обязательном порядке публикуются в свободном доступе на корпоративном портале НИУ ВШЭ.

Полный текст ВКР размещается в свободном доступе на портале НИУ ВШЭ только при наличии согласия студента – автора (правообладателя) работы либо, в случае выполнения работы коллективом студентов, при наличии согласия всех соавторов (правообладателей) работы. ВКР после размещения на портале НИУ ВШЭ приобретает статус электронной публикации.

ВКР являются объектами авторских прав, на их использование распространяются ограничения, предусмотренные законодательством Российской Федерации об интеллектуальной собственности.

В случае использования ВКР, в том числе путем цитирования, указание имени автора и источника заимствования обязательно.

Реестр дипломов НИУ ВШЭ