В России пройдет первая международная олимпиада по анализу данных
IDAO (International Data Analysis Olympiad) создана ведущими специалистами по анализу данных для своих будущих коллег. Своей целью олимпиада ставит объединение аналитиков, учёных, профессионалов и начинающих исследователей со всего мира вместе на одной площадке. Мероприятие подобного масштаба впервые состоится в России. Организаторами олимпиады выступают факультет компьютерных наук Высшей школы экономики, компания Yandex и Harbour.Space University при поддержке Сбербанка.
«Наша цивилизация находится в той точке, когда у нас есть техническая возможность собирать и хранить большие объемы данных. Но мы до сих пор не полностью понимаем всего, что с ними можно делать. Существует явная потребность в специалистах в области машинного обучения, наук о данных, и эта потребность будет только расти. Подобные олимпиады — это отличный способ поддержать талантливых молодых людей в их стремлении стать специалистами в этой области знаний», — комментирует Дмитрий Ветров, председатель жюри IDAO, профессор НИУ ВШЭ, заведующий международной лаборатории глубинного обучения и байесовских методов.
Вместе с тем методы, которые предлагаются в статьях или применяются на соревнованиях по машинному обучению, зачастую недостаточно эффективны, чтобы находить применение в реальных приложениях. Многие из них работают слишком медленно или требуют слишком большой объём памяти — их не получится использовать, скажем, в мобильном приложении. IDAO готова ответить на этот вызов. Участники будут стараться превзойти друг друга не только в качестве предсказаний, но и в практической эффективности используемых моделей.
Сложные задачи анализа данных и дополнительные требования к производительности модели сделают IDAO привлекательной и для участников соревнований по машинному обучению, и для любителей спортивного программирования. Более того, люди с разной подготовкой — аналитики и разработчики смогут объединяться в команды, чтобы создавать более совершенные и актуальные решения.
Международная олимпиада по анализу данных IDAO состоит из двух этапов. Первый, заочный онлайн-квалификационный раунд состоится на платформе Yandex.Contest с 15 января по 11 февраля 2018 года. На нём будет представлено два трека. Один — это традиционное соревнование по машинному обучению. На основании предоставленных данных с присвоенными им метками участникам необходимо будет сделать новые предсказания и загрузить их в систему автоматической проверки. Задание второго трека — придумать решение для той же задачи, укладывающееся в жёсткие рамки по времени и по используемому объёму памяти.
Не позднее, чем 18 февраля 2018 года на сайте IDAO будет опубликована таблица с результатами и список финалистов. 30 команд, ставших лучшими хотя бы на одном из треков будут приглашены померяться силами в Москву. Расходы по питанию и проживанию финалистов оргкомитет олимпиады берет на себя.
Второй, очный тур пройдет в апреле 2018 года, в Москве, в центральном офисе компании «Яндекс». За 36 часов соревнования участники попробуют не просто обучить модель, а создать полноценный прототип, который будет тестироваться как с точки зрения точности, так и с точки зрения производительности.
В рамках очного тура олимпиады также запланированы выступления и мастер-классы специалистов международного уровня по машинному обучению и анализу данных.
Победители IDAO получат ценные призы. Кроме того, факультет компьютерных наук НИУ ВШЭ и Harbor Space University предоставят победителям стипендии, полностью покрывающие стоимость обучения на своих образовательных программах.
Ветров Дмитрий Петрович
Профессор-исследователь Департамента больших данных и информационного поиска