Глубинное обучение в обработке звука

Бакалавриат 2024/2025

Лучший по критерию «Новизна полученных знаний»

Статус: Курс по выбору (Прикладная математика и информатика)

Направление: 01.03.02. Прикладная математика и информатика

Кто читает: Департамент больших данных и информационного поиска

Где читается: Факультет компьютерных наук

Когда читается: 4-й курс, 1, 2 модуль

Формат изучения: без онлайн-курса

Охват аудитории: для своего кампуса

Преподаватели: Аланов Айбек, Гринберг Петр Маркович, Каледин Максим Львович, Федоров Григорий Валерьевич

Язык: русский

Кредиты: 5

Дополнительные материалы в LMS Задать вопрос

Аннотация

Задача обработки звука, в частности человеческого голоса, представляет большой интерес в индустрии. В данном курсе будут рассмотрены в основном современные нейросетевые подходы для таких фундаментальных задач как распознавание и генерация голоса. Так же будут рассмотрены такие задачи как распознавание ключевых слов, голосовая биометрия, определение тишины, audio style transfer и генерация музыки.

Цель освоения дисциплины

Понимать как физически устроен звук, его характеристики и разные цифровые представления
Разбираться в современных подходах распознавания речи
Уметь написать и обучить нейронную сеть для распознавания речи и детекции ключевых слов