Мы используем файлы cookies для улучшения работы сайта НИУ ВШЭ и большего удобства его использования. Более подробную информацию об использовании файлов cookies можно найти здесь, наши правила обработки персональных данных – здесь. Продолжая пользоваться сайтом, вы подтверждаете, что были проинформированы об использовании файлов cookies сайтом НИУ ВШЭ и согласны с нашими правилами обработки персональных данных. Вы можете отключить файлы cookies в настройках Вашего браузера.

  • A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Генеративные модели для улучшения речиGenerative models for speech enhancement

Соискатель:
Андреев Павел Константинович
Члены комитета:
Каледин Максим Львович (НИУ ВШЭ, к.комп.н., председатель комитета), Бурнаев Евгений Владимирович (Сколковский институт науки и технологий, д.ф.-м.н., член комитета), Кипяткова Ирина Сергеевна (Спб ФИЦ РАН, к.т.н, член комитета), Кудинов Михаил Сергеевич (Huawei, к.т.н., член комитета), Рюмин Дмитрий Александрович (Спб ФИЦ РАН, к.т.н., член комитета)
Диссертация принята к предварительному рассмотрению:
29.08.2024
Диссертация принята к защите:
19.09.2024
Дисс. совет:
Совет по компьютерным наукам
Дата защиты:
16.12.2024
В диссертации рассматриваются современные методы улучшения речи с использованием генеративных моделей для преодоления ограничений регрессионных методов, которые часто приводят к чрезмерному сглаживанию сигнала и потере важных частотных компонент. В работе исследуется использование генеративно-состязательных сетей (GAN) для улучшения речи и предлагаются новые нейросетевые архитектуры для этой задачи. Также рассматривается новая методика обучения авторегрессионных моделей для улучшения речи с низкой задержкой в потоковых приложениях. В заключительной части работы разработана диффузионная вероятностная модель, позволяющая решать задачи инверсии деградаций речевых сигналов без точного знания модели деградации во время обучения. Диссертация включает как теоретические выводы, так и практические результаты, демонстрирующие повышение качества улучшения речи в различных сценариях.
Диссертация [*.pdf, 6.37 Мб] (дата размещения 4.10.2024)
Резюме [*.pdf, 1.93 Мб] (дата размещения 4.10.2024)
Summary [*.pdf, 1.89 Мб] (дата размещения 4.10.2024)

Публикации, в которых излагаются основные результаты диссертации



Отзывы
Отзыв научного руководителя
Отзыв члена Комитета
Сведения о результатах защиты:
Комитет по диссертации рекомендовал присудить ученую степень кандидата наук (протокол № 2 от 16.12.2024) ;Решением диссертационного совета (протокол № 13 от 26.12.2024) присуждена ученая степень кандидата компьютерных наук.
См. на ту же тему

Применение методов машинного обучения к идентификации частиц в детекторе LHCbКандидатская диссертация

Соискатель: Казеев Никита Александрович
Руководитель: Устюжанин Андрей Евгеньевич
Дата защиты: 21.10.2020