Состоялось очередное заседание общемосковского научного семинара "МАТЕМАТИЧЕСКИЕ МЕТОДЫ АНАЛИЗА РЕШЕНИЙ В ЭКОНОМИКЕ, БИЗНЕСЕ И ПОЛИТИКЕ"
Докладчик: М.Г. Крейнес (ООО «Базисные технологии»)
Тема: Оценка качества научных публикаций и вычислительные модели анализа текстов
Краткое описание доклада
Рассматрено использование вычислительных методов поиска и анализа неструктурированных текстов на естественных языках для решения задач оценки качества научных публикаций и коллекций научных публикаций. Предложены решения для двух типов задач:
- задач формирования коллекций научных публикаций, адекватных для определения референтных (сопоставимых) значений библиометрических и наукометрических показателей для конкретной публикации или конкретной коллекции публикаций,
- задач количественного определения информативности и содержательной независимости конкретной публикации.
Решение этих задач основано на
- вычислительном построении моделей научных текстов на естественных языках,
- вычислительном построении моделей коллекций научных текстов на естественных языках,
- поиске с использованием моделей содержательно и тематически близких статей (на поиске содержательного контекста анализируемой статьи),
- выделении среди тематически и содержательно близких текстов множества статей, адекватных для формирования референтных значений,
- поиске с использованием моделей коллекций текстов научных изданий, научных коллективов и организаций, порождающих тематически близкие коллекции текстов.
Рассматриваемые в докладе модели и методы, развитые и используемые в информационной технологии поиска и анализа текстовой информации КЛЮЧИ К ТЕКСТАМ , позволяют решать для масштабных коллекций неструктурированной текстовой информации следующие задачи:
- вычислительное выделение в коллекции тематических групп,
- отнесение текстов к выделенным тематическим группам,
- определение тематического сходства текстовых коллекций.