• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Улучшение 3D детекции объектов с X-Ray учителями.

ФИО студента: Гамбашидзе Александр Мерабович

Руководитель: Макаров Илья Андреевич

Кампус/факультет: Факультет компьютерных наук

Программа: Науки о данных (Магистратура)

Год защиты: 2024

В этой диссертации рассматриваются значительные проблемы обнаружения 3D объектов: разреженность и окклюзия. Существующие подходы часто зависят от дополнительных модулей или специфических архитектурных решений, что может ограничивать их адаптируемость к новым и развивающимся архитектурам. Эта работа первой представляет гибкую технику, которую можно легко интегрировать в любой существующий метод для 3D-обнаружения на основе LiDAR, представляя собой первый случай обобщения Weak-to-Strong в 3D компьютерном зрении. Мы представляем новую структуру, X-Ray Distillation с Object-Complete Frames, подходящую как для контролируемых, так и для полу-контролируемых сценариев, которая использует временной аспект последовательностей облаков точек. Этот метод извлекает критическую информацию из как предыдущих, так и последующих кадров LiDAR, создавая Object-Complete кадры, которые отображают объекты с различных ракурсов, таким образом решая проблемы окклюзии и разреженности. В связи с ограничением на невозможность создания Object-Complete кадров во время онлайн-вывода, мы используем Knowledge Distillation в рамках модели Teacher-Student. Этот подход мотивирует надежную модель Student имитировать поведение более слабой модели Teacher, которая обрабатывает простые и информативные Object-Complete кадры, эффективно предоставляя всесторонний обзор объектов, как будто сквозь рентгеновское зрение. Наш подход превосходит существующие методы в полу-контролируемом обучении на 1-1.5 mAP и улучшает пять проверенных моделей контролируемого обучения на 1-2 mAP на стандартных наборах данных для автономного вождения, даже с использованием стандартных гиперпараметров. Эта работа была принята на конференцию Computer Vision and Pattern Recognition (CVPR 2024) \cite{weak2strongxray}.

Выпускные квалификационные работы (ВКР) в НИУ ВШЭ выполняют все студенты в соответствии с университетским Положением и Правилами, определенными каждой образовательной программой.

Аннотации всех ВКР в обязательном порядке публикуются в свободном доступе на корпоративном портале НИУ ВШЭ.

Полный текст ВКР размещается в свободном доступе на портале НИУ ВШЭ только при наличии согласия студента – автора (правообладателя) работы либо, в случае выполнения работы коллективом студентов, при наличии согласия всех соавторов (правообладателей) работы. ВКР после размещения на портале НИУ ВШЭ приобретает статус электронной публикации.

ВКР являются объектами авторских прав, на их использование распространяются ограничения, предусмотренные законодательством Российской Федерации об интеллектуальной собственности.

В случае использования ВКР, в том числе путем цитирования, указание имени автора и источника заимствования обязательно.

Реестр дипломов НИУ ВШЭ