• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Итоги II Российско-французского научного семинара «Большие данные и решения на их основе»

Семинар состоялся 12-13 октября 2017г. в НИУ ВШЭ, был организован Школой бизнес-информатики НИУ ВШЭ и Институтом Mines-Télécom (IMT, Франция), при поддержке Посольства Франции в России и Министерства высшего образования, исследований и инноваций Франции (Ministère delʼEnseignement supérieur, de la Recherche et de lʼInnovation).

Это уже второй семинар российских и французских участников из ведущих научно-исследовательских центров, университетов, государственных структур и ИТ компаний, объединённых взаимным интересом к тематике «больших данных». Участники единодушно отметили важность продолжения проведения семинара и в следующем году. 

В настоящее время использование технологий больших данных является одним из приоритетных направлений научно-технологического сотрудничества между Россией и Францией. Основная задача семинара – укрепление научного и образовательного сотрудничества организаций обеих стран, работающих в области больших данных, обмен мнениями по актуальной теме использования технологий работы с большими данными в различных сферах и приложениях науки, бизнеса и государственного управления, а также налаживание партнерских связей с промышленностью и средними и малыми предприятиями в области ритейла и создание совместных проектов, в частности, в рамках европейских программ Горизонт 2020 – была полностью выполнена.

В течение двух дней прозвучало около 40 докладов, посвящённых самым разным аспектам проблематики больших данных – от рассмотрения методов и алгоритмов анализа данных до представления разнообразных практик применений этих методов.

Обсуждению новых математических моделей, методов и алгоритмов, технологических и программных решений работы с большими данными традиционно был посвящён целый спектр интереснейших докладов. 

Петр Голубцов (МГУ им. Ломоносова) представил взгляд на проблему больших данных с точки зрения теории информации. Научные сотрудники лабораторий INRIA (национального исследовательского института Франции в области компьютерных наук) Aurélien Bellet (INRIA, Lille) и Nataliia Bielova (INRIA, Sophia-Antipolis) рассказали, как работает коллаборативное машинное обучение и как сделать свой браузер безопаснее. Stéphan Clémençon из Института Mines-Télécom и Télécom ParisTech представил доклад о методах обработки слабых сигналов, а его коллега Florence d'Alché – о методах решения сложных задач прогнозирования. Antoine Chambille (ActiveViam) рассказал об успехах применения технологии «in-memory» обработки данных в бизнес задачах. Юрий Максимов (Сколковский институт науки и технологии) – о теоретических проблемах алгоритмов машинного обучения.

С новыми возможностями облачных и распределенных вычислений познакомили участников семинара Михаил Посыпкин из Федерального исследовательского центра «Информатика и управление» РАН и Anne-Sophie Taillandier (Teralab / Inst. Mines-Télécom, FR), а с особенностями работы с большими данными в программно-конфигурируемых сетях (SDN) – Владимир Ефимушкин из Центрального научно-исследовательского института связи.

Директор НИИ наукоемких компьютерных технологий Университета ИТМО (г. С.-Петербург) Александр Бухановский рассказал про интеллектуальную инфраструктуру для работы с большими данными.

Ряд докладов был подготовлен сотрудниками НИУ ВШЭ. Заведующий международной лабораторией глубинного обучения и байесовских методов Дмитрий Ветров познакомил участников семинара с подходами к регуляризации глубоких нейронных сетей. Ведущий научный сотрудник международной научно-учебной лаборатории анализа и выбора решений, профессор департамента анализа данных и искусственного интеллекта Борис Миркин поделился результатами исследований в области кластеризации, полученными в рамках международного сотрудничества с коллегами из Канады и Великобритании. Евгений Бурнаев, доцент кафедры технологий моделирования сложных систем, рассказал о регрессии на основе гауссовских процессов для обнаружения аномалий и поделился опытом успешного использования данного подхода в самых разнообразных компаниях: от индустрии моды до авиастроительной отрасли. Илья Кузьминов, заведующий отделом Института статистических исследований и экономики знаний, представил доклад о применении интеллектуального анализа текстов и семантического анализа в форсайт-исследованиях.

Ряд докладов был посвящён более «прикладным» аспектам использования технологий больших данных. Коллеги из Тулонского университета (Université de Toulon) Hervé Glotinи, Marion Poupard выступили с рассказом об использовании методов анализа больших данных для решения задач мониторинга различных видов животных; Ольга Горчинская из компании ФОРС представила доклад об успехах использования аналитики больших данных для лечения болезни Паркинсона; Александр Шаповал (НИУ ВШЭ) – об исследовании глобальной проблемы подъема уровня моря и необходимости использования методов нелинейного анализа данных для предсказания этого феномена.

Одно из интереснейших применений технологий больших данных — это анализ социальных сетей с целью сбора информации о профилях пользователей. Этому направлению исследований посвятили свои доклады Сергей Нечаев (Center Poncelet / Физический институт им. Лебедева) и Nataliia Bielova (INRIA Sophia-Antipolis).

Среди участников семинара была выпускница факультета бизнес-информатики (сейчас Школа бизнес-информатики) НИУ ВШЭ Дилара Хананнова, представляющая международную компанию FactSet. Дилара рассказала о проблематике работы с большими данными в финансовой отрасли.

То, что большие данные «по зубам» не только крупным компаниям и ученым с большим опытом исследовательской работы, но и молодым ученым, показали аспиранты ВШЭ: Павел Сулимов (руководитель Attila Kertesz-Farkas), Татьяна Махалова (руководитель Сергей Кузнецов) и Елизавета Прокофьева (руководитель Светлана Мальцева). Они рассказали о том, как обучать модели на основе многомерных вероятностных распределений, применять классификаторы на основе формальных понятий и предсказывать наплыв пациентов в больницах, существенно повышая при этом качество медицинского обслуживания.

Оживлённое внимание участников и гостей семинара вызвала сессия «Big Data in Retail» и последующая дискуссия в формате круглого стола. Проблемы, задачи и возможности использования технологий больших данных в розничной торговле обсуждали Arnaud Trousset (RetailIntelligence Location Solutions), Jérôme Baray (Univ. ParisXII), Мария Холод (РЭУ им. Г.В. Плеханова), Дмитрий Шостко (компания «МТС») и Анастасия Григорьева (X5 Retail Group).

Также, в рамках семинара была организована сессия, посвященная конкурсам и программам финансирования, при участии французской НКТ «Информационные и коммуникационные технологии», на которой выступили Pierre Simay (Inst. Res. & Innovation Coop. Manager / IMT / nat. PoC H2020 ICT), Maxime Baconnet (Посольство Франции в России) и Мария Путцелева – представитель отдела науки и технологий представительства Евросоюза в России. Цель сессии состояла в том, чтобы дать обзор финансовых условий для реализации исследований по направлению Большие данные в рамках программы «Горизонт 2020» (Европейская Комиссия), а также представить других программы по научно-исследовательскому и инновационному сотрудничеству между ЕС/Францией и Россией. На сессии также были представлены двусторонние программы для поддержки мобильности аспирантов и исследователей между Россией и Францией.

Прошедший семинар продемонстрировал как актуальность и необходимость разработки проектов в области больших данных, так и потенциал российско-французского сотрудничества. Важность постоянного диалога между представителями бизнеса и науки России и Франции в своем выступлении отметил проректор по международным связям НИУ ВШЭ Иван Простаков. Огромное значение подобных проектов, а также важность сотрудничества двух стран подчеркнул атташе по науке и технологиям г-н Aurélien Leynet на торжественном приеме участников семинара в Посольстве Франции.

Мы надеемся, что участие в семинаре принесет значимую пользу каждому его участнику и уже планируем следующую встречу в рамках III российско-французского научного семинара «Большие данные и решения на их основе».