О проекте
«Конструктор успеха»
Как найти свое место в жизни, заняться тем, что получается легко и приносит счастье? Для этого нужно правильно применить знания, которые дал университет и сама жизнь. В проекте «Конструктор успеха» мы рассказываем о выпускниках Высшей школы экономики, которые реализовали себя в интересном бизнесе или неожиданной профессии. Герои делятся опытом — рассказывают, какие шишки набивали и как использовали предоставленные им шансы.
Аягоз Мусабаева, выпускница магистратуры факультета компьютерных наук Вышки, с успехом нашла применение исследовательским навыкам в бизнесе. После работы в лаборатории базовой кафедры Института проблем передачи информации (ИППИ) на факультете математики НИУ ВШЭ она пришла в индустрию и сейчас ведет исследования в сфере машинного обучения в международной компании Akvelon. В интервью «Конструктору успеха» она рассказала, как data scientist может найти себя в киберспорте и что делать с дефицитом софт-скилов в IT.
Вам всегда нравилась математика? Как получилось, что вы выбрали это направление как профессиональное?
Да, математика мне в школе легко давалась, мой мозг как будто сам умел решать задачи. В институте все изменилось, пришлось научиться учиться. И это было очень здорово, потому что двигаться в математике очень интересно. Мой выбор вуза основывался на оценке моих способностей в сопоставлении с университетами, в которых можно учиться с таким бэкграундом. Выбор был небольшой, поскольку университетов, в доступности образования в которых я была бы уверена, не так много. Я остановилась на математическом направлении в казахстанском филиале МГУ, поскольку знала, что преподавать будут специалисты из Москвы и оканчивать обучение можно уже в России. Я бы поехала поступать в Москву, но мои родители были против того, чтобы я уехала из дома сразу после выпуска из школы.
Потом вы решили продолжить образование. Почему выбрали именно Вышку?
Я случайно наткнулась на курс Константина Воронцова по Data Science. Мне показалось, что это очень интересная и перспективная отрасль, в которой можно применять свои знания. На тот момент магистратур, где учили бы наукам о данных, было всего две, и программа в Вышке казалась более проработанной и глубокой. Также у меня были в группе поддержки старшие коллеги по мехмату: они могли помочь в первое время в освоении этого направления, подсказать необходимые вещи. Вышка мне всегда нравилась своим форматом, который сочетает в себе современность и открытость к экспериментам с академической фундаментальностью и при этом довольно прикладным фокусом. К тому же в Вышке достаточно лояльно относятся к студентам, здесь очень развита коммуникация преподавателей со студенческим сообществом, что создает развивающую среду.
Чему и кого учат на направлении Data Science?
В магистратуре Вышки дают основы, необходимые для того, чтобы заниматься Data Science как ученый и как специалист. Плюс ты можешь выбирать дополнительные курсы и углубляться в понравившиеся направления. Я бы сказала, что условно Data Science можно разделить на три направления: анализ данных, откуда выходят аналитики или дата-инженеры, классическое машинное обучение – это data scientist, которые работают с табличными данными, глубокое обучение – это data scientist, которые занимаются обработкой картинок, видео, аудио. Есть еще отдельные ранжирования по более мелким профессиям. Я выбрала зрение, поскольку это достаточно широко применимо.
Какую академическую подготовку предлагает магистратура и как вы ею воспользовались?
Магистратура позволила мне в первую очередь подтянуть знания Python и основных библиотек для работы с анализом данных. На факультете я работала в лаборатории ИППИ НИУ ВШЭ с медицинскими данными, мой математический бэкграунд позволил разобраться в сложных методах обработки медицинских изображений, а магистерские дисциплины помогли это все закодить, подкачав навыки программирования на Python. В лаборатории я нашла первую работу, это помогло развиться навыкам применения знаний на практике, поскольку реальные задачи сильно отличаются от того, что изучаешь по плану, пришлось тяжелым трудом конвертировать теорию в рабочие задачи. Учеба покрывает самые интересные части, посвященные придумыванию моделей, а непосредственно деятельность в лаборатории позволяет иметь дело с уже готовыми датасетами, когда большая часть работы data scientist упирается в подготовку данных и постановку задач.
Как вы попали в «Константу», какое влияние это оказало на ваше дальнейшее развитие?
Меня интересовала тема цифрового анализа и исследований зрения. Поэтому работу я искала как сomputer vision engineer. Я разместила резюме и параллельно проходила собеседования. Рекрутер «Константы» нашел меня сам. На тот момент у меня уже был оффер, поэтому я решила просто сходить на собеседование из любопытства. Там оказались очень классные ребята, мне очень понравилась обстановка и задачи, так что приняла их предложение с удовольствием. «Константа» занимается разработкой сайтов и мобильных приложений для букмекерских компаний. Под крылом этой компании находился небольшой отдел компьютерного зрения OSAI, который делал ресерч-проекты для спорта. В его задачи входили автоматизация аналитики просмотров спортивных трансляций и предоставление данных по разным видам спорта. В этом отделе я занималась автоматизацией получения данных из трансляций по киберспорту для букмекеров, а также созданием алгоритмов для автоматического сбора статистик по баскетболу.
Работа в коммерческой компании сильно отличается от академической. В индустрии я многому научилась, узнала про новые инструменты, освоила необходимые подходы, стратегии и практики. К тому же в такой прекрасной команде было легко учиться и работать. Это была моя первая работа на бизнес, мои хард-скилы здорово прокачались именно в плане целей и прикладных задач, я освоила многие инструменты, которые не требуются в академической области, и получила объемное представление о работе этих инструментов на благо бизнеса. Я продолжала заниматься наукой, поскольку «Константа» поощряет исследования и инициирует новые продукты на их основе, однако требования бизнеса к ресерчу отличаются от академических. Например, только в последние годы на конференциях для представителей индустрии появилось требование к имплементации и proof of state для их статей. То есть теперь с написанием статьи ты должен выложить рабочий код и кусочек данных, на которых люди смогут воспроизвести твою работу, так как вопрос имплементации многих статей стоит довольно остро.
Вы продолжали академическую деятельность на уровне университета?
Да, я поступила в аспирантуру ИППИ, написала несколько статей для международных и российских конференций. Меня пригласили выступить с одной из статей за рубежом, но я не попала на конференцию из-за политики получения виз. В конце концов я ушла из академической среды из-за выгорания, не окончив аспирантуру.
Смена фокуса в деятельности на практические задачи очень помогла мне восстановиться
Удачные отношения с работой постепенно выработали у меня более здоровый баланс между офисом и личной жизнью.
Data Science – определенно тренд. Как востребованность этого направления влияет на работу в этой сфере и на специалистов в ней?
Спрос на специалистов в этой области все еще велик, ищут подкованных, быстро соображающих ребят, в частности с академическим бэкграундом. Однако в индустрии зачастую много однообразных задач, сложно найти компанию, где есть достаточно большой разброс в проектах, возможности для экспериментов и роста. В крупных компаниях с ресерч-отделами, таких как «Авито», VK, «Яндекс», почти всегда есть место для исследований, где поощряется написание статей, как научных, так и научно-популярных – для блогов, изданий.
Data Science и вообще точные направления требуют от специалистов в первую очередь отменных фундаментальных знаний. Отчасти поэтому в сфере наблюдается дефицит софт-скилов. Ни в одной компании, с которыми имела дело напрямую или косвенно, я не видела четкой логики в организации рабочих процессов. Поскольку ML (machine learning – машинное обучение) все еще довольно новая отрасль как для бизнеса, так и для разработчиков, новые инструменты появляются постоянно, а время на изучение/внедрение/адаптацию этих инструментов не распределено рационально, менеджерам и руководителям приходится постоянно подстраиваться к неопределенности в сроках. В таких условиях редко можно работать эффективно и брать на себя четкие задачи.
Еще довольно частая проблема – это хорошие разработчики на руководящих позициях. Обычно они больше заинтересованы в своих собственных знаниях, нежели в развитии команды и менеджменте. Поэтому я постоянно сталкивалась с неорганизованностью – к сожалению, наряду с большими плюсами это является обратной стороной работы в бизнесе. Меня всегда интересовала оптимальность, поэтому с появлением все большего количества инструментов для оптимизации разработки машинного обучения хотелось бы получать и грамотный менеджмент.
Чем вы сейчас занимаетесь и где?
Я работаю в международной компании Akvelon. В основном компания занимается аутсорсом, но также делает и внутренние проекты. Задача, которая меня заинтересовала в этой компании, была посвящена инфраструктуре для разработки ML-проектов. Для любого ML-проекта нужны данные, которые необходимо хранить и версионировать, также нужно хранить модели и иметь возможность сравнивать их, вести учет метрик и хода разработки.
Все ML-проекты довольно емкие, как по ресурсам железа, так и по человеческим ресурсам, поэтому необходимо по возможности автоматизировать и упрощать процессы, чтобы ускорить работу. Для этого сейчас появляется все больше инструментов, которые могут работать в разных конфигурациях и условиях, заменяя процедурную механику. Поэтому мне хотелось бы попробовать больше развивать недавно появившиеся инструменты, такие как iterative.io, давая компании фидбэк и ускоряя автоматизацию. Благодаря пользователям и их мнению можно понять, какие вещи более важны для цифрового сообщества, какие есть недоработки, какие кейсы не учтены и т.д.
Планируете продолжать заниматься исследованиями или дальше расти в бизнесе?
Исследования на данный момент я могу вести лишь в рамках бизнес-задач. Какое-то время в Вышке я занималась менеджментом курса и популяризацией ИППИ. Мне кажется важным в первую очередь продвигать и развивать науку в академическом смысле, делая ее доступной и интересной. Думаю, что специалистам и ученым можно и нужно что-то делать для этого. Мне также было бы интересно внести свой вклад в популяризацию науки.
В индустрии сейчас много разных вызовов, поскольку требования пользователей к быстроте и качеству работы разных приложений довольно высокие. Это создает большие перспективы и стимулирует возникновение новых ниш, в которых могут найти свое место ML и цифровизация в целом, в том числе для прикладных исследований.
Хотелось бы повышать свои хард-скилы в этом направлении и развивать управленческие качества. Классическое математическое образование приносит результаты, но отсутствие углубленных базовых курсов программирования дает о себе знать. Я любознательный человек, в планах – наверстать софт-скилы и дополнить свои инженерные знания менеджерскими, чтобы оптимизировать процессы управления в бизнесе. Цифровой индустрии необходим грамотный менеджмент. Сначала думаю разобраться в минусах организационной работы, узнать больше про то, как устроена последовательная реализация проектов и почему в некоторых случаях, с которыми я неоднократно сталкивалась, процессы не могут быть организованы должным образом.