• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Индексы интересности замкнутых описаний в задачах анализа данных и обнаружения знанийInterestingness measures of closed patterns for data mining and knowledge discovery

Соискатель:
Махалова Татьяна Павловна
Члены комитета:
Калягин Валерий Александрович (Национальный исследовательский университет "Высшая школа экономики", доктор физико-математических наук, председатель комитета), Виноградов Дмитрий Вячеславович (Федеральный исследовательский центр «Информатика и управление» Российской Академии Наук , доктор физико-математических наук, член комитета), Дюнч Иво (Brock University (Канада), Habilitation (DSc), член комитета), Кучеров Григорий Аронович (University Paris-Est Marne-la-Vallée (Франция), кандидат физико-математических наук, член комитета), Пальчунов Дмитрий Евгеньевич (Новосибирский национальный исследовательский государственный университет, доктор физико-математических наук, член комитета)
Диссертация принята к предварительному рассмотрению:
3/12/2020
Диссертация принята к защите:
3/24/2020 (протокол №4)
Дисс. совет:
Совет по компьютерным наукам
Дата защиты:
5/29/2020
В условиях роста и накопления массивов данных особенно актуальной является задача обобщения, т.е. поиска паттернов — повторяющихся фрагментов, несущих полезную информацию.  В качестве паттернов в работе исследуются замкнутые описания (формальные и интервальные узорные понятия). В диссертации рассматриваются две группы подходов к поиску паттернов: статические и динамические. В статических подходах оценка интересности паттернов осуществляется посредством применения индексов интересности, в динамических — на основе оценки информативности паттернов относительно всего набора данных и других паттернов. В работе предложена классификация существующих индексов (метрик) интересности, эмпирически выявлены группы схожих индексов, а также индексов, устойчивых к шуму. Предложена схема адаптации индексов интересности произвольных паттернов к оценке замкнутых. Предложен метод интеграции статических (на основе индексов) и динамических (на основе принципа минимальной длины описания) подходов к майнингу паттернов.  Разработан динамический подход к майнингу числовых паттернов, основанный на принципах сжатия.
Диссертация [*.pdf, 4.94 Мб] (дата размещения 3/19/2020)
Резюме [*.pdf, 2.23 Мб] (дата размещения 3/19/2020)
Summary [*.pdf, 1.71 Мб] (дата размещения 3/19/2020)

Отзывы
Отзыв научного руководителя
Сведения о результатах защиты:
Комитет по диссертации рекомендовал присудить ученую степень кандидата наук (протокол № 2 от 29.05.2020). Решением диссертационного совета (протокол № 6 от 15.06.2020) присуждена ученая степень кандидата компьютерных наук.