Python и данные в практике
Магистры II курса проанализировали решения судей
Алексей Смагин, Виолетта Власова, Валентина Мызина, Андрей Нестеров и Карина Чотчаева просмотрели при помощи алгоритмов 780 тысяч приговоров российских судов за 2017-2018 годы.
Дата-исследователи нашли около 50 тысяч документов, тексты которых совпадают еще хотя бы с одним решением одного и того же судьи минимум на 80%.
По словам второкурсника Алексея Смагина, идея исследования возникла благодаря Андрею Заякину, сооснователю сообщества «Диссернет», ресурса по выявлению плагиата в диссертациях. Ребята писали код на Python и парсили данные с соответствующих сайтов.
«Помимо программирования было много чтения "глазами" — Андрей смотрел уже найденные совпадения и пытался понять, насколько они оправданы, и что эти судебные дела объединяет», - комментирует Алексей Смагин.
До этого студенты-практиканты работали над разметкой текстов: искали фабулу и реальные обстоятельства дела.
В результате журналисты составили рейтинг районных судов, которые копируют решения. С материалом можно ознакомиться здесь.
Хотите уметь также? Приходите к нам учиться!