В Вышке обсудили создание российско-французских проектов в области больших данных
Семинар «Большие данные и решения на их основе» был организован Школой бизнес-информатики НИУ ВШЭ и Институтом Mines-Télécom при поддержке Посольства Франции в России и Министерства высшего образования, исследований и инноваций Франции.
В настоящее время использование технологий больших данных является одним из приоритетных направлений научно-технологического сотрудничества между Россией и Францией. Основная задача семинара, который проходил уже во второй раз, — укрепление научного и образовательного сотрудничества организаций, работающих в этой области, создание совместных научных проектов (в частности, в рамках европейских программ «Горизонт 2020»), обмен мнениями по использованию больших данных в науке, бизнесе и государственном управлении, а также налаживание партнерских связей с промышленными и торговыми предприятиями. В работе семинара приняли участие проректор по международным связям НИУ ВШЭ Иван Простаков и атташе по науке и технологиям посольства Франции г-н Орельен Ленэ.
В течение двух дней на семинаре было представлено около 40 докладов, посвященных разным аспектам работы с большими данными — от методов и алгоритмов анализа данных до разнообразных практик применений этих методов.
Так, Петр Голубцов (МГУ им. Ломоносова) показал, как проблема больших данных рассматривается с точки зрения теории информации. Научные сотрудники лабораторий INRIA (национального исследовательского института Франции в области компьютерных наук) Орейан Белле и Наталья Билова рассказали, как работает коллаборативное машинное обучение и как сделать свой браузер безопаснее. Стефан Клеменсон (Институт Mines-Télécom и Télécom ParisTech) представил доклад о методах обработки слабых сигналов, а его коллега Флоранс д’Альше — о методах решения сложных задач прогнозирования. Антуан Шамбий (ActiveViam) рассказал об успехах применения технологии “in-memory” обработки данных в бизнес задачах, а Юрий Максимов (Сколковский институт науки и технологии) — о теоретических проблемах алгоритмов машинного обучения.
С новыми возможностями облачных и распределенных вычислений познакомили участников семинара Михаил Посыпкин из Федерального исследовательского центра «Информатика и управление» РАН и Анн-Софи Тайандьер (Teralab / Inst. Mines-Télécom), а с особенностями работы с большими данными в программно-конфигурируемых сетях (SDN) — Владимир Ефимушкин из Центрального научно-исследовательского института связи.
Директор НИИ наукоемких компьютерных технологий Университета ИТМО Александр Бухановский рассказал про интеллектуальную инфраструктуру для работы с большими данными.
Ряд докладов был подготовлен сотрудниками Вышки. Заведующий международной лабораторией глубинного обучения и байесовских методов Дмитрий Ветров познакомил участников семинара с подходами к регуляризации глубоких нейронных сетей. Ординарный профессор ВШЭ Борис Миркин поделился результатами исследований в области кластеризации, полученными в рамках международного сотрудничества с коллегами из Канады и Великобритании. Доцент кафедры технологий моделирования сложных систем Евгений Бурнаев рассказал о регрессии на основе гауссовских процессов для обнаружения аномалий и поделился опытом успешного использования данного подхода на практике, например, в индустрии моды и авиастроении. Заведующий отделом Института статистических исследований и экономики знаний ВШЭ Илья Кузьминов представил доклад о применении интеллектуального анализа текстов и семантического анализа в форсайт-исследованиях.
Ряд докладов был посвящен более «прикладным» аспектам использования технологий больших данных. Исследователи из Тулонского университета Эрве Глотен и Марион Пупар выступили с рассказом об использовании методов анализа больших данных для решения задач мониторинга различных видов животных. Ольга Горчинская из компании ФОРС представила доклад об успехах использования аналитики больших данных для лечения болезни Паркинсона. Профессор факультета компьютерных наук ВШЭ Александр Шаповал рассказал об исследовании глобальной проблемы подъема уровня моря и использовании методов нелинейного анализа данных для предсказания этого феномена.
Проблемы, задачи и возможности использования технологий больших данных в розничной торговле обсуждали Арно Трусс (Retail Intelligence Location Solutions), Жером Барэ (Univ. Paris XII), Мария Холод (РЭУ им. Г.В. Плеханова), Дмитрий Шостко (компания «МТС») и Анастасия Григорьева (X5 Retail Group).
Одно из самых интересных применений технологий больших данных — это анализ социальных сетей с целью сбора информации о профилях пользователей. Этому направлению исследований посвятили свои доклады Сергей Нечаев (Center Poncelet / Физический институт им. Лебедева РАН) и Наталья Билова.
Среди участников семинара была выпускница Школы бизнес-информатики ВШЭ Дилара Хананнова, представляющая международную компанию FactSet. Она рассказала о проблематике работы с большими данными в финансовой отрасли.
Работой с большими данными успешно занимаются не только крупные компании и признанные ученые, но и совсем молодые исследователи. Так, аспиранты ВШЭ Павел Сулимов, Татьяна Махалова и Елизавета Прокофьева рассказали о том, как обучать модели на основе многомерных вероятностных распределений, применять классификаторы на основе формальных понятий и предсказывать наплыв пациентов в больницах, существенно повышая при этом качество медицинского обслуживания.
Также в рамках семинара была организована сессия, посвященная конкурсам и программам финансирования, при участии французской НКТ «Информационные и коммуникационные технологии», на которой выступили Пьер Симей (Inst. Res. & Innovation Coop. Manager / IMT / nat. PoC H2020 ICT), Максим Баконне (Посольство Франции в России) и Мария Путцелева — представитель отдела науки и технологий представительства Евросоюза в России. Цель сессии состояла в том, чтобы дать обзор финансовых условий для реализации исследований по направлению Большие данные в рамках программы «Горизонт 2020» (Европейская Комиссия), а также представить других программы по научно-исследовательскому и инновационному сотрудничеству между ЕС/Францией и Россией. На сессии также были представлены двусторонние программы для поддержки мобильности аспирантов и исследователей между Россией и Францией.
Бурнаев Евгений Владимирович
Доцент кафедры технологий моделирования сложных систем
Ветров Дмитрий Петрович
Руководитель Департамента больших данных и информационного поиска
Кузьминов Илья Филиппович
Заведующий отделом информационно-аналитических систем
Миркин Борис Григорьевич
Ординарный профессор НИУ ВШЭ
Простаков Иван Валериевич
Проректор ВШЭ
Шаповал Александр Борисович
Профессор Департамента больших данных и информационного поиска