• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Обучение по данным как основа моделирования позы и внешности людей и виртуальных аватаровLearning from data for human modeling and tracking

Соискатель:
Бурков Егор Андреевич
Руководитель:
Лемпицкий Виктор Сергеевич (др. работы под рук-вом)
Члены комитета:
Савченко Андрей Владимирович (НИУ ВШЭ в Нижнем Новгороде, д.т.н., председатель комитета), Загоруйко Сергей Николаевич (Сколковский институт науки и технологий, PhD, член комитета), Куратов Юрий Михайлович (Институт искусственного интеллекта AIRI, к.ф.-м.н., член комитета), Панов Максим Евгеньевич (Университет искусственного интеллекта имени Мохамеда бен Заида (Объединенные Арабские Эмираты), к.ф.-м.н., член комитета), Феррер Гонзало (Сколковский институт науки и технологий, PhD, член комитета)
Диссертация принята к предварительному рассмотрению:
5/16/2024
Диссертация принята к защите:
6/13/2024
Дисс. совет:
Совет по компьютерным наукам
Дата защиты:
12/19/2024
Данная работа посвящена большой многогранной задаче компьютерного зрения — автозахвату движений и внешности человека. Работа построена на внедрении новых достижений в глубоком обучении, усиливающих опору на данные и облегчающих "ручное" построение моделей, даже если данные размечены слабо (модели, дифференцируемые целиком; самообучение; метаобучение; новые большие публичные наборы данных и т.п). Результат нашей работы — ряд новых алгоритмов автозахвата человека для четырех различных сценариев. Сначала, ориентируясь на системы телеприсутствия, мы рассматриваем задачу оценки ключевых 3D-точек тела. Для случая одной камеры мы предлагаем простой подход с MLP-регрессией, опираясь на большой набор данных с 3D-позами. Для случая нескольких камер мы реализуем две модели, напрямую обучаемые на минимизацию целевой функции в 3D, что делает их гораздо более устойчивыми к заслонениям и сложным позам, чем предыдущие подходы. Далее мы отмечаем фундаментальные недостатки ключевых точек (как представления позы в целом), выявленные в исследованиях выше, и обучаем специальную нейросеть неинтерпретируемому представлению позы по неразмеченному набору видео. Наконец, мы сосредотачиваемся на автозахвате внешности человека и реализуем решение для 3D-реконструкции головы по одному или нескольким RGB-изображениям, используя нейронные неявные функции, новый вид самообучаемых моделей, позволяющий обучить нашу модель всего на сотне примеров.
Диссертация [*.pdf, 22.05 Мб] (дата размещения 10/1/2024)
Резюме [*.pdf, 8.40 Мб] (дата размещения 10/1/2024)
Summary [*.pdf, 8.66 Мб] (дата размещения 10/1/2024)

Публикации, в которых излагаются основные результаты диссертации



Отзывы
Отзыв научного руководителя
Отзыв члена Комитета
Сведения о результатах защиты:
Комитет по диссертации рекомендовал присудить ученую степень кандидата наук (протокол № 2 от 19.12.2024);Решением диссертационного совета (протокол № 13 от 26.12.2024) присуждена ученая степень кандидата компьютерных наук.
См. на ту же тему

Методы повышения обобщающей способности моделей в задачах 3D компьютерного зренияКандидатская диссертация

Соискатель: Рахимов Руслан Ильдарович
Руководитель: Бурнаев Евгений Владимирович
Дата защиты: 9/30/2024

Обобщение нейронных сетей на алгебру дуальных чиселКандидатская диссертация

Соискатель: Павлов Станислав Владимирович
Руководитель: Калягин Валерий Александрович
Дата защиты: 7/23/2024

Современные методы машинного обучения в задачах интерпретации электрической активности головного мозгаКандидатская диссертация

Соискатель: Петросян Артур Тигранович
Руководитель: Осадчий Алексей Евгеньевич
Дата защиты: 1/10/2023