Проектная деятельность на ФиКЛе: о практике в НКРЯ и DeepPavlov
Юлия Короткова (выпускница ФиКЛа'23) расскывает о практике в Национальном корпусе русского языка и DeepPavlov во время учебы и о том, как этот опыт оказался полезным для развития карьеры.
Расскажи, над какими проектами ты работала в университете
В Национальном корпусе русского языка я вместе с научной группой работала над созданием и развитием парсера китайского языка. Группа состояла из студентов с совершенно разной экспертизой: от лингвистов-китаистов до инженеров машинного обучения. Конкретно я занималась исследованием стандартов и инструментов токенизации китайского текста и перевода иероглифов в пьининь. Во время работы над парсером мы писали статьи и выступали на конференциях. По итогу я собрала весь пайплайн парсера, который теперь работает в китайском подкорпусе НКРЯ: он разбивает китайские тексты по словам, транскрибирует их и определяет грамматические признаки.
А чем занималась в DeepPavlov?
Я была в команде Юры Куратова, которая занималась разработкой и исследованием трансформера с памятью. Перед практикантами стояла задача проанализировать механизма внимания внутри этого трансформера. В итоге мы провели ресерч методов анализа и интерпретации механизма внимания, а также разработали свои методы и продемонстрировали результаты перед всей лабораторией по окончании практики.
В планах было написать статью и выступить на конференции, но до этого так и не дошло. Однако потом я узнала, что наша работа была опубликована как часть большой статьи про RMT и RMDT (Recurrent Memory Decision Transformer). А еще во время практики у нас была возможность ездить в лабораторию DeepPavlov, работать и общаться вместе другими сотрудниками лаборатории, что было очень круто!
Была ли возможность остаться дальше работать в компаниях?
Да. В НКРЯ я проработала год, но это некоммерческая организация (мы работали по гранту), поэтому, когда мы завершили проект, команду расформировали. В DeepPavlov мне предложили продолжить сотрудничество, написать по результатам деятельности дипломную работу, но я на тот момент уже работала в другом месте и менять его не хотела. А вот мой однокурсник остался работать там и продолжил нашу совместную работу.
Какие знания и качества были нужны для участия в таких проектах?
Отбора на практики не было, но предварительно мы общались с их кураторами. В моем случае для НКРЯ было релевантно моё знание китайского языка и навыки разработки, которые я получила за первый год обучения на ФиКЛе, а для Deeppavlov – знания трансформеров, машинного обучения, NLP, что я в основном изучала вне рамок нашей программы. Так что тут все зависит от конкретного проекта и задач.
Если говорить о soft skills, то набор довольно стандартный: инициативность, умение работать в команде, ответственность. Было интересно вместе с командой выстраивать работу и коммуникацию: помню, как я предлагала формат синков (еженедельных созвонов) и организовывала все наши материалы, которые мы использовали в ходе исследований.
Важно понимать, что никто не ожидает, что студент будет обладать этими навыками, когда будет подаваться на практику. По идее практика для того и нужна, чтобы чему-то научить, в том числе и soft skills. Главное желание, а остальному научат!
Юлия Короткова
Чем ты занимаешься сейчас? Помог ли тебе опыт работы в проектах?
Я работаю в компании Just AI, которая специализируется на голосовых технологиях и чат-ботах, в команде синтеза речи — мы разрабатываем синтетические голоса и проводим исследования.
Опыт работы во всех проектах, которые у меня были в университете, очень помог! Моя компания как раз искала Data Scientist’а с бэкграундом в лингвистике, потому что они расширялись на международный рынок и нужно было работать не только с русским, но и со многими европейскими языками и китайским. В моем резюме было много проектов, связанных как раз с этим. Также мне пригодился опыт, который я получила в процессе написания курсовой работы (она была о расставлении ударения в русских текстах), и на работе как раз были такие задачи.
В целом и hard, и soft навыки, которые развиваются во время учебной практики, оказались очень полезны. Например, так как у меня был опыт работы в команде и выстраивания процессов, я смогла быстрее адаптироваться на новой работе. Кроме того, мой работодатель даже был немного в шоке, узнав, что я умею, потому что не предполагается, что стажер будет владеть большой экспертизой в ML и NLP.
Редакторы: Вероника Артибякина, Мария Бочарова.
Короткова Юлия Олеговна