Компьютерный лингвист
разрабатывает программы для обработки естественного языка, создает инструменты распознавания текста и речи, системы перевода, голосовых ассистентов, персональных помощников, «умных» чат-ботов
Человека окружает большое количество языковой информации, представленной в разных форматах: аудио-, видео-, текстовом. Используя алгоритмы обработки текста, лингвист имеет возможность собрать информацию о необходимых объектах: например, нравится ли зрителям определенный фильм или за кого будут голосовать пользователи твиттера на выборах.
Компьютерные лингвисты разрабатывают программы, которые воспроизводят когнитивную языковую деятельность человека — умение читать, понимать на слух, говорить, участвовать в диалоге, переводить с одного языка на другой. В их задачи входит создание инструментов, которые помогают извлекать лингвистическую информацию из текстов, размечать лингвистические признаки в текстах, создавать ресурсы для хранения лингвистических единиц, например, для хранения слов, их значений, их семантических и морфологических свойств.
Компьютерные лингвисты востребованы крупными IT-компаниями, чья деятельность связана с обработкой больших объемов текстовых или речевых данных. Они могут работать в науке, СМИ, торговле, финансах, здравоохранении — везде, где требуется применение современных информационных технологий к лингвистическим данным.
Оценки рынка
16,1%
составит ожидаемый среднегодовой рост рынка обработки естественного языка в мире в период с 2016 по 2021 год (с 7,63 до 16,07 миллиардов долларов)
Драйверы профессии
- усиление конкуренции и потребность компаний в детальном изучении поведения потребителей
- развитие семантического веба, машинного обучения, интеллектуальных систем и т. п.
- роботизация различных видов деятельности и использование «умных» устройств
- развитие межмашинных технологий (machine-to-machine technology)
Какие задачи будет решать специалист
- разработка алгоритмов и методов машинного перевода
- решение задач извлечения информации из неструктурированных или слабоструктурированных документов
- разработка систем человеко-машинного и межмашинного взаимодействия
- создание систем генерации однотипных текстов по заданным параметрам (прогноза погоды, биржевых сводок и др.)
- распознавание речи и выделение именованных сущностей
- разработка алгоритмов классификации документов по заданным параметрам
- создание вопросно-ответных систем
- разработка систем, облегчающих коммуникацию людям с ограниченными возможностями
Какие знания и навыки у него будут
- знание лингвистических технологий и умение выбирать данные, необходимые для решения поставленных задач
- знание баз данных и других источников, откуда можно получать данные
- умение программировать прототипы и модели решений, готовить необходимые лингвистические ресурсы, проектировать процесс обработки данных и интерпретировать результаты обработки
- умение оценивать трудоемкость разных решений, пороги допустимых ошибок и выбирать оптимальную методологию тестирования лингвистических систем
Другие профессии направления «общественные и гуманитарные науки»
Нашли опечатку?
Выделите её, нажмите Ctrl+Enter и отправьте нам уведомление. Спасибо за участие!