Студент программы «Науки о данных» занял первое место на международной олимпиаде IDAO
С 4 по 6 апреля в офисе Яндекса прошел финал международной олимпиады по анализу данных IDAO-2019, которую организуют факультет компьютерных наук НИУ ВШЭ и Яндекс при поддержке Сбербанка, крупнейшего российского банка, активно развивающего технологические направления ведения бизнеса. До финала добралась 31 команда, больше тысячи не смогли преодолеть отборочный этап, в котором нужно было решить задачу от мюонной исследовательской группы коллаборации LHCb Большого адронного коллайдера. 36-часовой финал, как и в прошлом году, был полон неожиданностей. Безумные идеи срабатывали, команды оказывались без капитана и всё равно двигались вперед, а победителем вообще оказался одиночка.
О задаче финала рассказывает разработчик машинного обучения
Яндекс.Такси Эмиль Каюмов:
Это одна из наших реальных задач — уметь предсказывать время ожидания следующего заказа для таксиста в аэропорту, чтобы водители лучше понимали, сколько им предстоит ждать клиента. Специфика в том, что мы расставляем заказы в порядке прибытия таксистов в аэропорт, так как, в отличие от города, здесь у пассажиров только одна точка, куда можно вызвать такси. Водители знают, сколько машин перед ними, но удобнее знать, сколько времени ждать своего заказа. В некоторых случаях можно находиться поближе к терминалу или передохнуть и выпить чашечку кофе, а иногда заказа ждать так долго, что лучше вернуться в центр города. В целом, участники IDAO решали эту задачу примерно тем же образом, что и мы, но можно было увидеть какие-то хорошие идеи, до которых мы не додумались. Например, кто-то в своем решении учитывал влияние разных дней недели и праздников на количество водителей и пассажиров. Это не совсем бизнес-задача, она не поможет компании заработать больше денег, но зато сделает жизнь водителей удобнее».
Команда Mylene Farmer ФКН ВШЭ и Авито — 1-е место
Илья Иваницкий:
«Так получилось, что я человек-команда. Мой друг неожиданно бросил меня и стал участвовать с другой командой, причем он так ничего не засабмитил за весь конкурс.
Я решил: какого черта! Выступлю в одиночку и сделаю это хорошо
С одной стороны, одиночество помогало, так как я понимал, что всё, что я хочу делать, я буду делать сам, у меня нет возможности скинуть задачу на другого человека, который, может, ничего и не сделает. Была такая предсказуемость и эффективность.
С другой стороны, было довольно грустно и скучно, особенно когда сидишь 36 часов на хакатоне один, постоянно кодишь и что-то запускаешь на сервере.
В следующий раз буду стараться участвовать командой, потому что это, по крайней мере веселее и приятнее».
Команда Zvezdochka* из Университета Иннополис — 2-е место
Эрнест Глухов, Дарья Запекина, Вячеслав Карпов:
«Мы все втроем учимся в Иннополисе на программе Data science. Команду сформировали еще в первом семестре, делали вместе домашние задания и маленькие проекты. Так что нам комфортно работать вместе, каждый понимает, на что способны остальные, и на соревнованиях мы умеем действовать сообща.
У нас нет четкого разделения ролей: Эрик молодец, мы тоже молодцы. Мы все генерим идеи и пытаемся их сообща имплементировать
В офлайн-этапе было тяжело. Он короткий, задача интересная, и много чего хотелось попробовать. Ты имплементируешь что-то новое, оцениваешь, улучшаешь результаты, но тут уже четыре часа утра, и уже очень хочется отдохнуть.
Мы стали постепенно улучшать наш результат: то есть у нас есть baseline, добавляем функцию, если она что-то улучшает, то оставляем. И мы довольно рано поняли, что мы оказались в лидерах. Мы только волновались о том, какие данные будут использоваться для финальных результатов, потому что если эти данные не похожи на те, на которых мы валидировались прежде, то мы делали какую-то бесполезную ерунду, которую нельзя использовать. Но мы увидели, что данные похожи на те, которые мы использовали, и наконец выдохнули».
TEAM X – 3-е место
Андрей Куценко МГУ; Сергей Коломиец – Тюменский Государственный Университет; Назар Бекназаров – ФКН ВШЭ:
«Вообще участие в IDAO было спонтанным, написал знакомый в общий чат, собрали команду, начали решать первый этап.
Первый этап был про разделение элементарных частиц. Про них мы знали ровным счетом ничего. За 4 вечера в антикафе и со знаниями найденными в википедии мы подготовили простенькое решение, но сделали его робастным. На паблике мы были 20 на прайвате вырвались в 5-ку, повезло. Мы прошли в финал.
Далее на втором туре все было уже по-другому, решение надо было подготовить за 36 часов, а задача достаточно нестандартная. Мы немного разбирались во временных рядах и применили все, что знали о них, так же пытались получить больше информации о прилетах/вылетах самолетов, но, к сожалению, это не повлияло на качество. Через 36 часов, мы уставшие и невыспавшиеся отправляем решение на прайват, на паблике мы были уже пятые. Без особых надежд мы пошли отмечать окончание недели. Но на следующий день нам намекнули, что хорошо было бы нам приехать. Я без особого энтузиазма выехал, как я думал, на лекцию или что-то в этом духе. Мои компаньоны также. Мы были удивлены своему третьему месту. Наверное, аналогично с первым этапом вырвались наверх за счет робастности.
В итоге IDAO нам понравился, задачи были неординарные и интересные, а организация на высоте».
BarelyBears из Токийского университета — 4–5-е место (совместно с командой shadd из Белорусского государственного университета информатики и радиоэлектроники)
Хироси Йосихара, Косаку Оно, Наоки Маэда:
«Большим испытанием для нас стал онлайн-этап с задачей про мюоны от исследовательской группы коллаборации LHCb. Описание задачи на сайте было просто огромным, сложно было даже начать. Хорошо, что Оно учил физику в университете, это помогло с пониманием проблематики элементарных частиц.
Финальный раунд тоже удивил. Мы работали все 36 часов, сабмитили много моделей и довольно быстро заняли высокое место в рейтинге. Российские команды начали активно сабмитить только к концу 36-часового испытания.
Мы с ужасом наблюдали, как сразу много команд внезапно стали резко набирать очки. Это было очень неожиданно и страшно для нас!»
Unnamed:0 из Университета Иннополис — 9-е место
Дламини Гсинизве Сифетфо и Руфина Галиева:
«Мы увидели плакат в университете и решили: почему бы не попробовать, мы же дата саентисты! И зарегистрировались в последний день. Мы не так уж и готовились, если признаться. Подумали, что увидим задачу и попробуем ее решить, так, как это и происходит в реальной жизни.
Команда сложилась стихийно: мы друзья, вместе учимся на магистерской программе Data science в Иннополисе. Нас должно было быть трое, полная команда, но капитан недавно перенес операцию и не смог приехать. Пришлось справляться вдвоем.
Во время финала у нас было много безумных идей, применяли всё, что приходило в голову. Иногда это работало, иногда нет».
Тройка лучших команд получила призы от партнеров IDAO 2019. Lenovo отметили победителей мощнейшими ноутбуками LEGION Y740 и планшетами х705L, а компания Яндекс вручила участникам, занявшим третье место, Яндекс.Телефоны. Кроме того, результаты олимпиады будут учитываться в портфолио кандидатов при поступлении в магистратуру факультета компьютерных наук ВШЭ, а в Школу анализа данных Яндекса можно будет поступить без онлайн-тестирования и экзамена. Такую возможность предоставят участникам первых 10 команд в рейтинге IDAO. Останется только пройти собеседование.