Выступление Б.Г. Миркина и Д.С. Фролова (НИУ ВШЭ) на тему "Обобщение в таксономиях: модель, метод, приложения"
15 мая 2019 г. в НИУ ВШЭ состоялось очередное заседание общемосковского научного семинара "МАТЕМАТИЧЕСКИЕ МЕТОДЫ АНАЛИЗА РЕШЕНИЙ В ЭКОНОМИКЕ, БИЗНЕСЕ И ПОЛИТИКЕ".
Рассматривается предметная таксономия типа Классификационной системы компьютерных наук, разработанной всемирной ассоциацией вычислительных машин (ACM-CCS 2012). Нас интересует тот аспект понятия «обобщение», который определяется как «выведение общего смысла из частностей». Разумное обобщение должно «поднять» нечеткое множество листьев дерева таксономии S к ее «головному» понятию, вершине верхнего яруса дерева таксономии. Головное понятие должно «плотно» покрывать множество запроса S, с точностью до некоторых ошибок, «провалов» и «выбросов». Провал – это вершина, покрываемая головным понятием, но не принадлежащая S (ошибка первого рода). Выброс – вершина, которая входит в S, но не покрывается головным понятием (ошибка второго рода). Наш метод ЭкОНеМ глобально минимизирует общее количество головных понятий, провалов и выбросов, взятых с определенными весами (совместная работа с Т. Феннером (Лондон) и С. Насименто (Лиссабон)). Рассматриваются два приложения:
- Анализ тенденций научного направления «Наука данных» по коллекции около 18000 публикаций из 17 журналов издательства Шпрингер за последние 20 лет. Существующие подходы к анализу тенденций основаны на анализе сетей взаимного цитирования и не могут дать уровня обобщения, достигаемого при нашем подходе.
- Эффективное увеличение аудитории интернетных объявлений (в 2-3 раза).