• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Проектная деятельность на ФиКЛе: о практике в НКРЯ и DeepPavlov

Юлия Короткова (выпускница ФиКЛа'23) расскывает о практике в Национальном корпусе русского языка и DeepPavlov во время учебы и о том, как этот опыт оказался полезным для развития карьеры.

Проектная деятельность на ФиКЛе: о практике в НКРЯ и DeepPavlov

Фото: Елена Охапкина, AIRI

Расскажи, над какими проектами ты работала в университете

В Национальном корпусе русского языка я вместе с научной группой работала над созданием и развитием парсера китайского языка. Группа состояла из студентов с совершенно разной экспертизой: от лингвистов-китаистов до инженеров машинного обучения. Конкретно я занималась исследованием стандартов и инструментов токенизации китайского текста и перевода иероглифов в пьининь. Во время работы над парсером мы писали статьи и выступали на конференциях. По итогу я собрала весь пайплайн парсера, который теперь работает в китайском подкорпусе НКРЯ: он разбивает китайские тексты по словам, транскрибирует их и определяет грамматические признаки.

А чем занималась в DeepPavlov?

Я была в команде Юры Куратова, которая занималась разработкой и исследованием трансформера с памятью. Перед практикантами стояла задача проанализировать механизма внимания внутри этого трансформера. В итоге мы провели ресерч методов анализа и интерпретации механизма внимания, а также разработали свои методы и продемонстрировали результаты перед всей лабораторией по окончании практики.

В планах было написать статью и выступить на конференции, но до этого так и не дошло. Однако потом я узнала, что наша работа была опубликована как часть большой статьи про RMT и RMDT (Recurrent Memory Decision Transformer). А еще во время практики у нас была возможность ездить в лабораторию DeepPavlov, работать и общаться вместе другими сотрудниками лаборатории, что было очень круто!

Была ли возможность остаться дальше работать в компаниях?

Да. В НКРЯ я проработала год, но это некоммерческая организация (мы работали по гранту), поэтому, когда мы завершили проект, команду расформировали. В DeepPavlov мне предложили продолжить сотрудничество, написать по результатам деятельности дипломную работу, но я на тот момент уже работала в другом месте и менять его не хотела. А вот мой однокурсник остался работать там и продолжил нашу совместную работу.

Какие знания и качества были нужны для участия в таких проектах?

Отбора на практики не было, но предварительно мы общались с их кураторами. В моем случае для НКРЯ было релевантно моё знание китайского языка и навыки разработки, которые я получила за первый год обучения на ФиКЛе, а для Deeppavlov – знания трансформеров, машинного обучения, NLP, что  я в основном изучала вне рамок нашей программы. Так что тут все зависит от конкретного проекта и задач.

Если говорить о soft skills, то набор довольно стандартный: инициативность, умение работать в команде, ответственность. Было интересно вместе с командой выстраивать работу и коммуникацию: помню, как я предлагала формат синков (еженедельных созвонов) и организовывала все наши материалы, которые мы использовали в ходе исследований.

Важно понимать, что никто не ожидает, что студент будет обладать этими навыками, когда будет подаваться на практику. По идее практика для того и нужна, чтобы чему-то научить, в том числе и soft skills. Главное желание, а остальному научат!

Важно понимать, что никто не ожидает, что студент будет обладать этими навыками, когда будет подаваться на практику. По идее практика для того и нужна, чтобы чему-то научить, в том числе и soft skills. Главное желание, а остальному научат!

Юлия Короткова

Чем ты занимаешься сейчас? Помог ли тебе опыт работы в проектах?

Я работаю в компании Just AI, которая специализируется на голосовых технологиях и чат-ботах, в команде синтеза речи — мы разрабатываем синтетические голоса и проводим исследования.

Опыт работы во всех проектах, которые у меня были в университете, очень помог! Моя компания как раз искала Data Scientist’а с бэкграундом в лингвистике, потому что они расширялись на международный рынок и нужно было работать не только с русским, но и со многими европейскими языками и китайским. В моем резюме было много проектов, связанных как раз с этим. Также мне пригодился опыт, который я получила в процессе написания курсовой работы (она была о расставлении ударения в русских текстах), и на работе как раз были такие задачи.

В целом и hard, и soft навыки, которые развиваются во время учебной практики, оказались очень полезны. Например, так как у меня был опыт работы в команде и выстраивания процессов, я смогла быстрее адаптироваться на новой работе. Кроме того, мой работодатель даже был немного в шоке, узнав, что я умею, потому что не предполагается, что стажер будет владеть большой экспертизой в ML и NLP.

 

Редакторы: Вероника Артибякина, Мария Бочарова.