Меня вдохновляет результат работы с данными
Елена Сидорова закончила бакалавриат и магистратуру факультета экономических наук НИУ ВШЭ, заканчивает Аспирантскую школу по экономике и работает научным сотрудником Вышки. Преподает такие курсы как эконометрика, экономика и право, макроэкономика. На онлайн встрече с абитуриентами и студентами магистратуры Экономический анализ Елена рассказала, как ей помогла магистратура, про свой опыт работы с данными, и почему ей нравится работа с данными
Кому и зачем нужна магистратура
Когда студент решает, стоит ли ему идти в магистратуру, то главный вопрос, на самом деле, нужна ли вообще магистратура. Когда я закончила бакалавриат, я понимала, что у меня есть знания по экономике. Зачем идти в магистратуру и стоит ли, это решение для каждого. Некоторые идут в магистратуру, чтобы немного изменить фокус своего направления. У нас в магистратуре было много ребят с физфака, с мехмата, с других направлений, которые хотели сфокусироваться на экономике. Я закончила бакалавриат по экономике, но считала, что мне немного не хватает знаний в области анализа данных. Я хотела бы углубить эти знания, поскольку видела в этом перспективы для себя и для развития карьеры. В магистратуре у нас было несколько предметов, связанных с эконометрикой, с анализом данных и моделированием в целом. У нас была эконометрика продвинутого уровня, где мы рассматривали все виды моделей, были курсы по панельным данным, отдельно курсы по качественным данным, по временным рядам. Именно такая насыщенность программы анализом данных, эконометрикой, мне очень помогла понять, какие задачи бизнеса могут решаться и какими моделями, почему именно эти модели должны использоваться в бизнесе для решения определенных прикладных задач. Это то, что дала мне магистратура.
Это стало основой, дальше я начала сама развиваться в анализе данных, проходить дополнительное обучение и бесплатно, и платно, но именно основу я получила в магистратуре, где у меня произошло такое углубление в предметную область.
Лаборатория конкурентной и антимонопольной политики: Младший научный сотрудник
Сейчас у меня большое количество разнонаправленных проектов, они связаны с анализом данных в применении к бизнес-задачам. У есть меня опыт проектов в нескольких областях. В целом мне интересна не просто аналитика, мне интересен поиск инсайтов, которые помогают бизнесу отвечать на возникающие вопросы. Также мне интересно моделирование, построение интерпретируемых статистических моделей, когда нам нужно понять, как какой-то конкретный фактор влияет на нашу зависимую переменную.
Например, как маркетинговые кампании повлияли на целевое действие аудитории и, как следствие, величину прибыли компании. Или что может повлиять на вероятность наступления определенного события, то есть, какой фактор и каким образом он может повлиять на вероятность наступления такого события. Это одно направление, а другое направление моделирования, которое мне интересно, это Data Science, модели машинного обучения. Такие модели работают по принципу черного ящика, когда у нас есть несколько факторов или фичей, как их называют на жаргоне, и мы настраиваем модель, параметры модели. А дальше можем предсказать, например, вероятность мошеннических действий, вероятность того, что клиент осуществит покупку или совершит какое-то действие.
Опыта работы со скоринговаными моделями у меня больше, но я также понимаю, как работают модели и других механизмов. Результат работы с данными меня вдохновляет. Сперва у нас есть большая таблица неструктурированных данных, после их предварительной обработки и графического анализа, мы смотрим на распределение, строим модель, после этого мы можем ответить на вопрос, который интересует бизнес и перенести это результат, который финансово измерим. И меня вдохновляет результат работы, который находятся на стыке академических знаний и бизнеса.
Почему и студенты, и бизнес так полюбили кейс-чемпионаты?
Тема анализа данных и моделирования затянула меня в магистратуре. Как раз когда я начала участвовать в кейс-чемпионатах и делать более прикладные исследования. Сейчас у студентов очень популярны хакатоны и кейс-чемпионаты. Хакатоны про программирование и анализ больших данных, а кейс-чемпионаты - это соревнование команд и решение бизнесовых задач. Когда у бизнеса есть задачи, например, разработать стратегию выхода на новый рынок, стратегию позиционирования продукта на рынке, построить модель, которая будет предсказывать наступление некоторого события. Компании сейчас очень активно проводят такие соревнования по решению стратегических бизнес-задач, поскольку, с одной стороны, это позволяет им посмотреть под необычным для себя углом на какую-то задачу, которая их волнует. С другой стороны, они через такие соревнования обычно дают офферы на стажировки и на дальнейшую работу, поскольку для них важен вопрос качества их сотрудников. У участников есть всего неделя на то, чтобы погрузиться в новую отрасль и выдать решение. Надо сказать, что мне очень повезло с командой, мы все были супер заинтересованы и много работали над кейсом. Это классный челлендж, который позволяет погружаться в любую отрасль - от ритейла до металлургии.
Кейс о вероятности банкротства заемщика
Обычно в бизнесе проекты закрытые, ты подписываешь обязательство, и про них нельзя рассказать. Я приведу пример проекта, который является открытым и расскажу почему он кажется мне интересным.
Этот проект был на кейс-чемпионате. С моей точки зрения, это один из самых сложных кейсов, которые у нас были. В условиях ограниченного времени мы с командой довольно хорошо с ним справились. Сперва я опишу общими словами, а потом определю то, что мне кажется самым интересным.
Нам была поставлена задача предсказать вероятность банкротства заемщика. Причем, это юридические лица, то есть у нас есть ряд компаний, по которым у нас есть финансовая отчетность, не малый и средний бизнес (МСБ), на МСБ есть свои методы оценки. И задача состоит в том, чтобы предсказать вероятность банкротства такого заемщика. Эта интересная задача может решаться двумя способами: методами машинного обучения и статистическими методами. На момент, когда мы решали такую задачу, мы выбрали статистические методы решения, поскольку там была особенность.
Во-первых, мы в большей степени специализировались на статистических методах и эконометрике. Во-вторых, там не было разметки, то есть у нас не было переменной, которая бы размечала данные - компания на самом деле банкрот или не банкрот. Эту разметку нам нужно было создать. И вот это основная сложность, когда разметки нет. У нас была всего неделя на то, чтобы это сделать. И для того чтобы понять: компания является банкротом или нет, нужно было разработать свой уникальный способ оценки. В данном случае такой, который позволит быстро определить, промаркировать компании по принципу: является ли компаний потенциально дефолтной или нет. Для этого нами было проанализировано несколько разных моделей.
Существуют разные подходы, которые позволяют проиндексировать компании как потенциально более рисковые. Такие подходы подразумевают анализ нескольких финансовых показателей и на основе этой информации создают некоторый индекс. Соответственно, нами был выбран один из таких методов, который позволял на основе имеющихся у нас данных, а данные у нас были по финансовой отчетности компаний (также в нашу задачу входило дополнить это макроэкономическими показателями и показателями того, как ведет себя конкретная индустрия), мы создали такой индекс, как the distance to default. Затем мы еще скорректировали этот индекс на основе того, как ведет себя отрасль, и на основе макроэкономических показателей. Когда времени не так много, а на решение у нас была неделя, мы как раз корректировали этот индекс на основе поведения отрасли, базируясь на уже существующих исследованиях, в основном, зарубежных, в отношении того, каким образом характеристики индустрии повышают или понижают вероятность банкротства. На основе имеющихся исследований можно скорректировать базовый индекс по фирме и далее еще скорректировать их на макроэкономические показатели. Быстрый способ - использовать некоторые исследования по макроэкономике, которые показываются мультипликативный эффект изменений в отрасли или экономике в зависимости от воздействия. И получается индекс, который позволяет нам разметить, является ли компания рисковой или не является. Далее мы можем просто проиндексировать, пометить, что компания рисковая или компания менее рисковая, и на основании этого оценить модель, базируясь на показателях отчетности компаний. С одной стороны, это позволяет нам спрогнозировать вероятность банкротства для каждого заемщика, выделить из них наиболее рисковых и менее рисковых и, соответственно, дать такую ценность для бизнеса в отношении того, как каждый конкретный финансовый показатель компании влияет на вероятность банкротства. Это полезно для компании, поскольку на основе таких моделей компания может корректировать политику сегментации клиентов в отношении выдачи кредитов, продажи продуктов, и ребалансировать продуктовый портфель.
Это такой неоспоримый плюс вообще эконометрических моделей, которые мы можем проинтерпретировать. С одной стороны, мы прогнозируем вероятность банкротства заемщика, и, с другой стороны, мы можем посмотреть, как каждый показатель, каждый конкретный компонент всего этого процесса влияет на вероятность банкротства.
Здесь задача, связанная с анализом данных, довольно ярко иллюстрирует прикладную пользу. Когда мы начинаем решать любую бизнесовую задачу, первое - это понять заказчика. Этот заказчик может быть внутренний или внешний. Если мы находимся в отделе, то кто является заказчиком задачи: мы сами или какое-то другое подразделение? На каждом из этапов работы необходима калибровка результатов с заказчиком. Если не до конца понятно, что хочет заказчик, то проект будет неудачным.
С точки зрения подхода к решению задач, есть некоторые универсальную принципы: нужно проанализировать имеющееся решение. В данном случае была модель, и мы смотрели на модель. Если это стратегический кейс, то смотрим на решения, которые существуют на рынке, и уже с учетом фильтров и критериев заказчика к решению задачи мы начинаем оптимизировать имеющееся решение на рынке, генерировать какие-то свои идеи, для того чтобы выдать решение, которое бы устраивало и заказчика, и в то же время отвечало тенденциям рынка.
С декабря 2021 Елена возглавила Центр подготовки к кейс-чемпионатам и олимпиадам для студентов на факультете экономических наук.
Инстаграм: https://www.instagram.com/fast_track.hse/
Вконтакте: https://vk.com/fast_track_hse
Телеграм: https://t.me/fast_track_hse