• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта
Магистратура 2020/2021

Робастные методы в статистике

Статус: Курс по выбору (Науки о данных)
Направление: 01.04.02. Прикладная математика и информатика
Когда читается: 1-й курс, 1, 2 модуль
Формат изучения: без онлайн-курса
Преподаватели: Цитович Иван Иванович
Прогр. обучения: Науки о данных
Язык: русский
Кредиты: 4
Контактные часы: 52

Программа дисциплины

Аннотация

Учебная дисциплина «Робастные методы в статистике» является логическим продолжением и развитием курса «Теория вероятностей и математическая статистика», где будет показано, каким образом необходимо формулировать задачу, где предполагается использование статистических методов, а так же каким образом необходимо адаптировать классические статистические методы принятия решений в зависимости от условий статистического эксперимента, на базе которого принимается решение. Такой подход необходим в тех случаях, когда необходимо принять гарантийное решение, т.е. такое решение, риски которого могут быть надежно оценены. Будут рассмотрены необходимые модификации классических статистических методов тех случаях, когда вероятность ошибки очень мала и решение должно приниматься не на основе классических предельных теорем теории вероятностей, а на основании теории больших уклонений. Будут рассмотрены алгоритмы, позволяющие правильно учитывать «выбросы» в выборке, которые обычно рассматриваются как ошибочные наблюдения и отбрасываются. Сегодня грамотный практик обязан учитывать множество факторов, влияющих на процесс формирования данных наблюдений, и использовать статистические решения, устойчивые к негативному влиянию неконтролируемых негативных факторов, влияющих на результаты наблюдений и дисциплина «Робастные методы в статистике» позволит правильно выбирать методы обработки данных в зависимости от природы формирования данных и целей их обработки.
Цель освоения дисциплины

Цель освоения дисциплины

  • научить методике постановки конкретных задач анализа статистических данных в зависимости от природы формирования данных и целей их обработки
  • научить выбирать адекватные статистические методы решения задачи обработки данных наблюдений и правильно интерпретировать получаемые статистические выводы
Планируемые результаты обучения

Планируемые результаты обучения

  • знать теоретические основы математической статистики: статистическая структура, статистический фильтр, статистический эксперимент, функция цели, регуляризирующий функционал;
  • знать отличительные особенности робастных статистических выводов; их положительные и отрицательные свойства
  • правильно формулировать задачу обработки данных в зависимости от природы формирования данных и целей их обработки;
  • уметь выбирать робастный статистический критерий в зависимости от точности доступных данных наблюдений и целей решения статистической задачи
  • уметь строить гарантийные решающие правила принятия решений по данным наблюдений
Содержание учебной дисциплины

Содержание учебной дисциплины

  • Классические методы математической статистики.
    Выборка. Эмпирические характеристики выборки и их свойства: выборочная функция распределения, выборочное среднее, выборочные центральные моменты, выборочные квантили. Статистики. Достаточные статистики. Примеры семейств вероятностных распределений и достаточных статистик. Понятие оценки неизвестного параметра. Функция риска оценки. Среднеквадратичный риск. Свойства оценок: несмещенность, состоятельнось, эффективность. Асимптотические характеристики качества оценок. Оценки максимального правдоподобия и их свойства. Метод моментов оценивания параметров. Проблема эффективного оценивания. Информационное количество Кульбака-Лейблера. Информационное количество Фишера и его связь с информационным количеством Кульбака-Лейблера. Неравенство Рао-Крамера. Доверительные интервалы и множества. Принципы построения доверительных интервалов и доверительных множеств. Задача проверки простых статистических гипотез. Статистический критерий. Критерий Неймана-Пирсона. Задача проверки сложных статистических гипотез. Параметрические и непараметрические гипотезы. Проблема ошибок первого и второго рода. Байесовский и гарантийный подходы. Построение статистических критериев проверки параметрических гипотез с использованием доверительных множеств. Критерии согласия. Построение статистических критериев проверки непараметрических гипотез. Критерии Колмогорова и Колмогорова-Смирнова. Критерии однородности.
  • Основные понятия робастной математической статистики
    Предмет математической статистики. Статистический фильтр. Вероятностные меры: абсолютно непрерывные и ортогональные меры. Плотность вероятностной меры. Теорема Радона-Никодима. Влияние статистического фильтра на свойства мер. Примеры семейств вероятностных распределений. Принципы формирования семейств вероятностных распределений. Проблема нарушения условий проведения экспериментов. Примеры построения статистической структуры. Статистическое решение. Примеры статистических задач. Функции ущерба и риска статистического решения на примере задачи проверки статистических гипотез. Понятие о робастности статистических решений в широком и узком смысле. Статистические модели распределения наблюдений с примесями и их влияние на устойчивость эмпирических характеристик выборки. Понятие о субоптимальном статистическом решении.
  • Робастные методы принятия решений
    Информационные расстояния между вероятностными мерами и их свойства. Гарантийное решающее правило в задачах проверки непараметрических гипотез. Влияние скорости убывания хвостов распределений на гарантийное решающее правило. Рекомендации по учету «выбросов» в статистических данных. Задача выбора весов порядковых статистик для обеспечения субоптимальности решающего правила. Группировка данных наблюдений для повышения эффективности решающего правила. Задача оценивания параметров распределений, заданных с ошибками. Свойства оценок параметров распределений, если наблюдаемое распределение не принадлежит предполагаемому параметрическому множеству. Правила выбора функции риска для построения робастных оценок параметров. Оценки параметров на основании порядковых статистик. Влияние выбора весов на эффективность оценивания параметров распределений.
Элементы контроля

Элементы контроля

  • неблокирующий домашняя работа 1
    оценивается по 10-бальной шкале
  • неблокирующий домашняя работа 2
    оценивается по 10-бальной шкале
  • неблокирующий контрольная работа
  • неблокирующий онлайн опрос
  • неблокирующий онлайн контрольная работа
  • неблокирующий Посещение лекций
  • неблокирующий работа на семинаре
  • неблокирующий Инициативная тема
  • неблокирующий экзамен
    Билет на экзамене состоит из двух теоретических вопросов и задачи. Все задания имеют одинаковый вес в оценке за экзамен.
Промежуточная аттестация

Промежуточная аттестация

  • Промежуточная аттестация (2 модуль)
    Накопленная оценка: О=(ДЗ1+ДЗ2+КР+0.5*К1+0.5*К2)/4+1/20*(Л+C)+0.2*А
Список литературы

Список литературы

Рекомендуемая основная литература

  • Математическая статистика : учебник для вузов, Горяинов, В. Б., 2008
  • Теория вероятностей и математическая статистика : учеб. пособие для вузов, Гмурман, В. Е., 2000
  • Теория вероятностей и математическая статистика : Учеб. пособие для студентов, Шведов, А. С., 1995

Рекомендуемая дополнительная литература

  • Валеев, С., Кувайскова, Ю., & Юдкова, М. (2010). Робастные методы оценивания: программное обеспечение, эффективность. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsbas&AN=edsbas.CF3D17C7
  • Вероятность и математическая статистика : энциклопедия, , 1999
  • Математическая статистика. Оценка параметров. Проверка гипотез : учеб. пособие для вузов, Боровков, А. А., 1984
  • Чубич, В. М., & Прокофьева, А. Э. (2017). Сравнительный Анализ Некоторых Робастных Фильтров Для Нестационарных Линейных Дискретных Систем. Bulletin of Irkutsk State Technical University / Vestnik of Irkutsk State Technical University, 21(12), 123–137. https://doi.org/10.21285/1814-3520-2017-12-123-137
  • Шестопал Оксана Викторовна. (n.d.). Робастные Методы Получения Адекватных Статистических Моделей. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsclk&AN=edsclk.https%3a%2f%2fcyberleninka.ru%2farticle%2fn%2frobastnye-metody-polucheniya-adekvatnyh-statisticheskih-modeley