• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Кластерный анализ банков методами машинного обучения на данных открытых источников

ФИО студента: Бочкарев Сергей Максимович

Руководитель: Сергиенко Дмитрий Олегович

Кампус/факультет: Факультет экономических наук

Программа: Экономика (Бакалавриат)

Год защиты: 2024

Российский банковский сектор столкнулся с множеством препятствий в последние 5 лет: пандемия COVID-19, начало СВО, санкции, отток специалистов. Появившиеся специфичные инфраструктурные, операционные и рыночные риски требуют новых моделей определения риск-профиля банков. Исследование направлено на разработку метода определения риск-профиля банков с помощью кластеризации. Метод является дополнением к традиционным инструментам определения риска. Результаты кластеризации дают альтернативные подход и интерпретацию склонности банков к специфичным рискам. ЦБ РФ может использовать модель для оценки банковских рисков, выявления специфичных паттернов, проведения внутрикластерных стресс-тестирований. Данные для исследования взяты из: banki.ru, Коммерсантъ, Frank RG. Применялся парсинг сайтов. Новизна исследования заключается в использовании несколько типов данных: банковские финансовые показатели и нормативы, состав банковских портфелей, клиентские отзывы, новости. Авторы использовали ранее применяемые в литературе методы кластеризации и современные ML-подходы. По каждому направлению применено несколько методов и подобраны параметры. Лучшие результаты дали K-means и спектральная кластеризации. Полученные кластеры проинтерпретированы и проверены на статистическую значимость. Даже на уровне 5% значимыми оказались не менее 5 кластеров. Ключевое новшество работы – объединение типов данных в 1 датасет. Метрики качества кластеризации и метрика b-cubed оказались выше по объединенной модели, но результаты менее интерпретируемы. По результатам моделирования было выявлено: поделить российские банки по риск-профилю возможно, разные источники данных дают схожие результаты, на объединенной модели качество кластеризации выше. Результаты резонируют с предыдущими исследованиями. Для будущего развития работы можно расширить выборку банков, детализировать показатели в датасетах, применить передовые нейросетевые методы кластеризации.

Выпускные квалификационные работы (ВКР) в НИУ ВШЭ выполняют все студенты в соответствии с университетским Положением и Правилами, определенными каждой образовательной программой.

Аннотации всех ВКР в обязательном порядке публикуются в свободном доступе на корпоративном портале НИУ ВШЭ.

Полный текст ВКР размещается в свободном доступе на портале НИУ ВШЭ только при наличии согласия студента – автора (правообладателя) работы либо, в случае выполнения работы коллективом студентов, при наличии согласия всех соавторов (правообладателей) работы. ВКР после размещения на портале НИУ ВШЭ приобретает статус электронной публикации.

ВКР являются объектами авторских прав, на их использование распространяются ограничения, предусмотренные законодательством Российской Федерации об интеллектуальной собственности.

В случае использования ВКР, в том числе путем цитирования, указание имени автора и источника заимствования обязательно.

Реестр дипломов НИУ ВШЭ