Большие данные: конкуренция за таланты как главный вызов
Как системы интеллектуального анализа больших данных позволяют генерировать новые знания? Какое влияние эти системы оказывают на информационное поле каждого из нас? Что такое «зоопарк» больших языковых моделей? Эти и многие другие вопросы обсудили участники симпозиума по big data, проведенного Институтом статистических исследований и экономики знаний НИУ ВШЭ (ИСИЭЗ) в рамках XXII Апрельской международной научной конференции, организованной Вышкой и Сбером.
Перспективные инструменты, подходы, стандарты и этические принципы, на которые опираются разработчики систем интеллектуальной аналитики, обсудили участники I Международного научного симпозиума «Использование анализа открытых больших данных для целей выявления глобальных трендов и вызовов, связанных с формированием и использованием человеческого потенциала». Мероприятие собрало ведущих исследователей в области анализа больших данных и смежных областей из ряда профильных центров и факультетов ВШЭ, а также МФТИ, Роспатента, Сбера, академических институтов и других организаций.
Ландшафт российских ИИ-разработок
Руководитель программного комитета симпозиума, заместитель директора Центра стратегической аналитики и больших данных ИСИЭЗ НИУ ВШЭ Илья Соченков представил панорамный доклад о российских центрах компетенций, работающих в области искусственного интеллекта (ИИ). Собрать детализированную информацию об этих организациях, позволившую, в частности, ранжировать их по уровню исследовательского потенциала в приоритетных областях, выделенных в Национальной стратегии развития ИИ, помогла система интеллектуального анализа больших данных iFORA, разработанная в ИСИЭЗ.
О постоянно расширяющемся функционале и новых приложениях iFORA рассказал директор Центра стратегической аналитики и больших данных ИСИЭЗ Илья Кузьминов.
Сейчас система нацелена, кроме агрегации новых массивов данных, на представление результатов в виде компактных, понятных разным пользователям визуализаций
Как расчеты iFORA помогли сформировать новый десятилетний план научно-технологического развития ЮАР, показал руководитель Лаборатории исследований науки и технологий ИСИЭЗ Озчан Саритас, прокомментировав ряд стадий национального форсайт-проекта, реализованного при участии Вышки.
От российского флагмана в области цифровых инноваций и предиктивной аналитики – Сбера – выступили два докладчика. Татьяна Шаврина, лидер команды AGI NLP в Управлении развития компетенций по исследованию данных, рассказала об исследованиях в области новейших языковых моделей, используемых для развития методов обработки естественного языка – NLP. Она представила «зоопарк» больших языковых моделей – BERT, GPT-3 и других, сопроводив оценкой перспектив их применения для русского языка. Команды ВШЭ, Сбера и Huawei в рамках проекта RuSentEval разрабатывают методику оценки языковых моделей с точки зрения их средней производительности по девяти высокоинтеллектуальным задачам (среди них, например, целеполагание и тест на здравый смысл).
О других перспективных совместных разработках Сбера и НИУ ВШЭ, основанных на моделях машинного обучения, и их применении для решения научных и бизнес-задач, связанных с получением неявных знаний, рассказал Павел Бахтин. Работая в департаменте надежности блока «Технологии», где он возглавляет направление по исследованию данных, Павел учится в аспирантуре ИСИЭЗ. Он закончил магистратуру ВШЭ по программе «Управление в сфере науки, технологий и инноваций».
О возможностях управления технологиями на основе анализа патентной информации рассказал Олег Ена, руководитель проектного офиса Федерального института промышленной собственности (ФИПС). Он сфокусировал свое внимание на разборе перспективных направлений эволюции искусственного интеллекта для задач патентной аналитики.
Big Data-фокус в измерениях человеческого потенциала
Старший научный сотрудник Форсайт-центра ИСИЭЗ Юлия Мильшина рассказала о совместном проекте с ГК «Росатом», в ходе которого были изучены глобальные тренды, значимые для понимания долгосрочных тенденций развития рынка труда и усиления человеческого потенциала. Проект, сам по себе иллюстрирующий вовлеченность бизнеса в повестку устойчивого развития, выявил, например, распространение новых форматов работы и подходов к управлению персоналом, принципов многообразия и инклюзивности в корпоративной культуре, внимание к правам человека в корпоративной этике.
Перспективные направления рынка труда и изменения кадровой политики в условиях пандемии проанализировали представители Российской академии наук – Юлия Отмахова, ведущий научный сотрудник Центрального экономико-математического института, и Дмитрий Девяткин, научный сотрудник ФИЦ «Информатика и управление». Их расчеты на основе анализа больших коллекций полнотекстовых документов показали, что в 2020 году сильнее всего выросли такие области, как фармакология (причем на первом месте оказались не разработки вакцин, а новых антидепрессантов), диагностические инструменты, логистика, беспроводные технологии и сельскохозяйственная техника. Ученые также выявили крупнейшие научные и производственные центры, определяющие развитие российского рынка труда по этим направлениям.
XXII Апрельская международная научная конференция по проблемам развития экономики и общества (АМНК) пройдет с 13 по 30 апреля этого года. Впервые соорганизаторами конференции выступят Высшая школа экономики и Сбер. В рамках конференции состоится серия научных и экспертных обсуждений в формате Дискуссионного клуба ВШЭ и Сбера – экспертной площадки, где представители науки, бизнеса и государства на базе научного знания обсуждают актуальные вызовы для экономики и общества и делятся лучшими практиками развития бизнеса и институтов, формируя образ будущего.
Как методы работы с большими данными начинают использоваться в программных системах персонализированного адаптивного обучения, показали в совместном докладе сотрудники факультета компьютерных наук НИУ ВШЭ Алексей Незнанов, Ольга Максименкова и директор Центра развития навыков и профессионального образования Института образования НИУ ВШЭ Федор Дудырев. Представленные результаты опираются на реальный педагогический опыт НИУ ВШЭ на всех уровнях образования, а также на практику разработки современных информационных систем поддержки учебного процесса.
Департаменты, связанные с человеческими ресурсами, меньше всего используют большие данные и решения на основе ИИ, в отличие от отделов маркетинга и продаж, подчеркнула профессор-исследователь МИЭМ им. А.Н. Тихонова НИУ ВШЭ Светлана Мальцева. Между тем уже заметен тренд на лавинообразное увеличение потоков данных, которые могут собираться и попадать в контур управления персоналом. Для качественного анализа такой чувствительной информации нужно унифицировать и повышать стандарты в области технологий анализа больших данных применительно к задачам управления персоналом, поскольку собираемые с устройств и анализируемые в условиях реального времени данные о работниках, будь то оценки эффективности их труда или психологического состояния, не всегда отражают реальность.
Словом, борьба за таланты обостряется – это самый важный бизнес-ресурс, с которым многие корпорации в первую очередь связывают устойчивое развитие.
Ящик Пандоры или ларец возможностей?
Инструменты аналитики на основе больших данных, как и любые другие, несут определенные риски. На одном заострил внимание в своей презентации главный аналитик Центра компетенций НТИ «Искусственный интеллект» МФТИ Игорь Пивоваров.
Современный человек выступает мишенью тысяч информационных систем, каждая из которых стремится под углом своих бизнес-целей выстроить его информационное поле
В острой гонке таргетированной рекламы, соцсетей, поисковиков, рекомендательных и других сервисов наибольший вес имеют те информационные системы, что обладают наибольшими вычислительными мощностями. Игорь Пивоваров полагает, что компании-разработчики таких сервисов должны четко прописывать и публично декларировать принципы работы с пользовательскими данными, а гарантировать их соблюдение должны независимые этические комитеты.
Еще один представитель МФТИ, заведующий Лабораторией нейронных систем и глубокого обучения Михаил Бурцев, продемонстрировал в режиме реального времени на примере возглавляемого им проекта iPavlov, насколько органично может строиться диалог с разговорными системами, основанными на ИИ, и призвал участников симпозиума использовать открытую библиотеку DeepPavlov для создания своих диалоговых систем.
Видеозаписи сессий симпозиума доступны по ссылкам из анонса на сайте ИСИЭЗ.
В рамках XXII Апрельской конференции Институт статистических исследований и экономики знаний НИУ ВШЭ также проводит с 13 по 16 апреля Международный научный симпозиум «Форсайт и научно-техническая и инновационная политика».
Дудырев Федор Феликсович
Соченков Илья Владимирович