Fear and Loathing and DH: чем запомнился участникам четвёртый хакатон Центра цифровых гуманитарных исследований НИУ ВШЭ
13 ноября состоялся уже четвёртый хакатон DH-центра. Весь день с утра и до позднего вечера исследователи составляли образ врача на основе упоминаний в соцсетях, знакомились с трендами мем-культуры за последние десять лет и даже ненадолго попробовали себя в роли тренера покемонов.
13 ноября 2021 года в 11:00 стартовал четвёртый по счёту хакатон, организованный и проведённый на базе Центра цифровых гуманитарных исследований НИУ ВШЭ. Более десяти команд попробовали свои силы в программировании, анализе данных, визуализации и машинном обучении на разнообразном наборе датасетов. Данные действительно были всякие: корпус эволюции законопроектов между чтениями в Госдуме; оцифрованная коллекция почтовых открыток «Пишу тебе», предоставленная интернет-изданием “Системный Блокъ”; корпус дневниковых записей, собранный проектом «Прожито»; тексты о врачах от НИИ здравоохранения и медицинского менеджмента ДЗМ г. Москвы; коллекция мемов с сайта imgflip и корпус интервью проекта «Народная история России».
Это уже второй хакатон, проведённый в онлайн-формате. Как показывает практика, онлайн не только не помешал коммуникации, но и расширил горизонты. Участники были самого разного возраста и представляли множество организаций из разных городов: были как первокурсники-бакалавры из Школы лингвистики, так и аспиранты-программисты; участники подключались из Москвы, Перми, Самары, Казани и даже Тувы. Некоторые участники объединились в команды заранее, кто-то предпочёл работать в одиночестве, а кто-то нашёл себе команду прямо на месте.
Перед командами стояло множество задач, варьирующихся в зависимости от датасета. В основном это были задачи, поставленные самими участниками, но были и предложенные организаторами. Команды, работающие с датасетом о врачах, должны были собрать информацию об образе медицинского работника в соцсетях и по возможности предложить возможности его поддержания и улучшения.
Те, кто работал с открытками, заинтересовались корреляцией между геоданными и содержанием.
Исследователи мемов и дневников провели частотную аналитику текстов своих корпусов, а команды “Народной истории России” заинтересовались историей исчезнувших географических объектов и сконструировали социокультурную модель Москвы.
Самым популярным оказался датасет законопроектов; исследователи определяли взаимосвязь между темой закона и скоростью его принятия, отслеживали корреляцию между активностью депутата и его шансами быть избранным повторно и даже обучили свой генератор законопроектов.
В основном исследования проводились с помощью языка программирования Python, но использовали и R, и Excel, и даже Word.
В конце хакатона участники представили результаты своей работы на общей зум-встрече. Хакатон успешно завершили десять команд и три исследователя-одиночки. Мы узнали много нового: например, что самые активные отправители и получатели открыток в России живут в южных регионах.
Оказалось, что самым популярным мемом за последние 10 лет является “ну тот, где офисного работника выкидывают из окна”; что больше всего исчезнувших объектов находится в центре Москвы; что активных депутатов не всегда переизбирают; что о врачах часто говорят в религиозном контексте...
Мы узнали, что в большинстве районов Москвы жители часто обсуждают места отдыха, а кому-то даже удалось пособирать покемонов с помощью анализа дневников.
Несмотря на упорную работу, общая атмосфера на хакатоне оставалась дружелюбной и ненапряженной. Участники поддерживали друг друга, и уже выступившие команды часто с удовольствием оставались послушать других. Хакатон чуть-чуть не дотянул до полуночи, продлившись 12 часов и 50 минут.
Вот как отзываются о прошедшем хакатоне его участники:
Командная работа, возможность взаимодействия с коллегами. Понравилось смотреть результат других команд, смотреть другие проекты/датасеты. Море положительных эмоций и заряд энергии. Дружеская атмосфера- Николай Попов, команда “ЮННА”, магистратура “Цифровые методы в гуманитарных науках”, НИУ ВШЭ Пермь
- Елена Клячко, команда “Альфа”, аспирант Школы лингвистики, НИУ ВШЭ Москва
- Ахмед Магомедов, исследователь-одиночка, магистратура “Цифровые методы в гуманитарных науках”, НИУ ВШЭ Москва
- Евгений Типсин, команда “Альфа”, Atlas Biomed Group
Большое спасибо всем огранизаторам и участникам хакатона, а также организациям, предоставившим данные для анализа!