Магистратура
2020/2021





Математические основы анализа данных
Лучший по критерию «Полезность курса для Вашей будущей карьеры»
Лучший по критерию «Полезность курса для расширения кругозора и разностороннего развития»
Лучший по критерию «Новизна полученных знаний»
Статус:
Курс обязательный (Цифровые методы в гуманитарных науках)
Направление:
45.04.03. Фундаментальная и прикладная лингвистика
Кто читает:
Школа лингвистики
Где читается:
Факультет гуманитарных наук
Когда читается:
1-й курс, 2-4 модуль
Формат изучения:
без онлайн-курса
Прогр. обучения:
Цифровые методы в гуманитарных науках
Язык:
русский
Кредиты:
4
Контактные часы:
64
Программа дисциплины
Аннотация
Курс «Математические основы анализа данных» читается на 1-ом курсе магистерской программы «Цифровые методы в гуманитарных науках». Формат изучения: без использования онлайн курсов. Изучение данной дисциплины базируется на знаниях и компетенциях, полученных при изучении следующих дисциплин: Математика (адаптационный курс). Основные положения дисциплины должны быть использованы в дальнейшем при изучении следующих дисциплин: «Цифровые гуманитарные науки» (1 курс), «Введение в науку о данных» (1 курс).
Цель освоения дисциплины
- Знакомство студентов со следующими разделами: теория графов, конечные выражения и регулярные языки, теория вероятностей и статистика, необходимых для изучения прикладных дисциплин и дальнейшего практического применения. Формирование у слушателей ясного представления о базисных понятиях и методах данных разделов.
- Развитие логического мышления и умения оперировать абстрактными объектами, привитие навыков корректного математических понятий и символов для выражения различных количественных и качественных отношений.
- Развитие навыка строгих математических рассуждений и доказательств.
Планируемые результаты обучения
- Умение использовать формулу Байеса и формулу полной вероятности.
- Умение использовать формулу Мувра-Лапласа и центральную предельную теорему и формулу для решения задач.
- Владение методом максимального правдоподобия, критерием Стьюдента, критерием хи- квадрат Пирсона.
- Понимание основных определений в теории графов, владение алгоритмом Дейкстры и алгоритмом Чу-Лю- Эдмондса.
Содержание учебной дисциплины
- Тема 1 Вероятность .Основные законы распределения случайных величин. Дискретные инепрерывные случайные величины. Числовые характеристики распределений: математическое ожидание, дисперсия и моменты старших порядков. Биномиальное и геометрическое распределения. Непрерывные распределения. Нормальное распределение на прямой. Распределение Пуассона. Совместное распределение случайных величин. Ковариация и коэффициент корреляции.
- Тема 2 Предельные теоремы в теории вероятностей .Неравенство Чебышева. Локальная и интегральная теоремы Муавра-Лапласа, теорема Пуассона. Закон больших чисел в форме Бернулли. Центральная предельная теорема.
- Тема 3 Статистика.Статистика и вероятность. Случайная выборка и ее объем. Эмпирическая функция распределения. Гистограмма и полигон. Выборочные моменты, мода и медиана. Выборочное среднее и выборочная дисперсия. Статистики и их выборочные распределения. Распределения хи-квадрат (Пирсона), Стьюдента и Фишера. Распределение выборочного среднего и выборочной дисперсии для нормальных выборок. Лемма Фишера. Доверительные интервалы для параметров нормального закона. Проверка гипотез о среднем и дисперсии для нормальных выборок. Постановка задачи оценивания параметров. Оценки параметров. Свойства оценок – несмещенность, состоятельность, асимптотическая нормальность, эффективность. Минимаксные и байесовские оценки. Методы построения точечных оценок. Метод моментов. Метод наибольшего (максимального) правдоподобия. Постановка задачи проверки гипотез. Статистический критерий. Основная и альтернативная гипотезы. Уровень значимости и мощность критерия. Проверка параметрических гипотез. Проверка непараметрических гипотез. Критерий согласия хи-квадрат Пирсона для простой и сложной гипотезы.
- Тема 4 Теория графов .Понятие ориентированного и неориентированного графа. Полный граф. Степень вершины графа. Подсчёт количества рёбер в графе. Изоморфизм графов. Понятие пути и цикла в графе, связные графы, сильно связные ориентированные графы. Дерево и подсчёт количества рёбер в дереве. Остовное дерево. Понятие планарного графа. Формула Эйлера для планарных графов. Таблица смежности данного графа, вычисление количества путей длины n по таблице смежности. Алгоритм Дейкстры поиска кратчайшего пути. Алгоритм Борувки. Алгоритм Чу-Лю-Эдмондса и его применение в лингвистических задачах. Теория графов и социальные сети.
Элементы контроля
- ЭкзаменЭкзамен пройдет 20 июня c 12:00 до 14:30 на платформе Zoom. Понадобится компьютер с камерой, поддерживающий Zoom. Для участия в экзамене студент обязан включить камеру в Zoom. Демо версия экзамена доступна в приложении.
- Контрольная работа
- Домашнее задание 1
- Домашнее задание 2
- Домашнее задание 3
- Домашнее задание 4
Промежуточная аттестация
- Промежуточная аттестация (4 модуль)0.15 * Домашнее задание 1 + 0.1 * Домашнее задание 2 + 0.1 * Домашнее задание 3 + 0.15 * Домашнее задание 4 + 0.2 * Контрольная работа + 0.3 * Экзамен
Список литературы
Рекомендуемая основная литература
- Дискретная математика : курс лекций для студентов-механиков, Редькин, Н. П., 2006
- Задачи и упражнения по дискретной математике : учеб. пособие, Гаврилов, Г. П., 2005
- Задачник по теории вероятностей для студентов социально - гуманитарных специальностей, Макаров, А. А., 2015
- Теория вероятностей : учебник для экономических и гуманитарных специальностей: учеб. пособие для вузов, Тюрин, Ю. Н., 2009
Рекомендуемая дополнительная литература
- Графы и их применение, Оре, О., 2006
- Графы и их применение, Оре, О., 2008