Бакалавриат
2020/2021
Научно-исследовательский семинар "Анализ данных"
Лучший по критерию «Полезность курса для расширения кругозора и разностороннего развития»
Лучший по критерию «Новизна полученных знаний»
Статус:
Курс обязательный (Бизнес-информатика)
Направление:
38.03.05. Бизнес-информатика
Кто читает:
Кафедра высшей математики
Где читается:
Факультет экономики, менеджмента и бизнес-информатики
Когда читается:
2-й курс, 4 модуль
Формат изучения:
без онлайн-курса
Преподаватели:
Радионова Марина Владимировна
Язык:
русский
Кредиты:
4
Контактные часы:
48
Программа дисциплины
Аннотация
Курс НИС «Анализ данных» призван сформировать у студентов практические навыки использования статистических и эмпирических методов анализа данных в ходе разработки и экспериментального исследования новых программных продуктов; приобретение студентами базовых знаний по основам анализа данных; знакомство с прикладными задачами дисциплины; анализ алгоритмов обработки статистических и эмпирических данных, используемых в современном программном обеспечении; развитие умений, позволяющих использовать опыт применения статистических и эмпирических методов обработки данных для решения задач экономического анализа и моделирования. В результате освоения дисциплины студент должен: знать основные понятия анализа данных, необходимые для дальнейшего изучения других дисциплин, предусмотренных учебным планом; уметь применять методы дисциплины для решения задач, возникающих в других дисциплинах; производить статистические расчеты в стандартных постановках, давать содержательную интерпретацию результатов вычислений, обрабатывать эмпирические и экспериментальные данные иметь навыки (приобрести опыт) представление о сферах применения и возможностях статистических и эмпирических методов.
Цель освоения дисциплины
- • приобретение студентами базовых знаний по основам анализа данных;
- • знакомство с прикладными задачами дисциплины;
- • анализ алгоритмов обработки статистических и эмпирических данных, используемых в современном программном обеспечении;
- • получения практических навыков использования статистических и эмпирических методов анализа данных в ходе разработки и экспериментального исследования новых программных продуктов;
- • развитие умений, позволяющих использовать опыт применения статистических и эмпирических методов обработки данных для решения задач экономического анализа и моделирования.
Планируемые результаты обучения
- Решает задачи на проверку данных на выбросы, нормальное распределение.
- Решает задачи корреляционного анализа и проверки статистических гипотез на наличие взаимосвязи между признаками. Может оценить взаимосвязь между несколькими переменными. Знает параметрические и непараметрические методы оценки
- Решает задачи классификации и кластеризации пространства наблюдений
- Решает задачи построения и проверки на качество регрессионных моделей
Содержание учебной дисциплины
- Предварительный анализ данныхСтатистические методы обработки экспериментальных данных. Основные понятия и задачи математической статистики. Генеральная совокупность, выборка, результаты наблюдений, статистика, статистическая оценка, требования к оценкам. Классификация признаков по шкалам измерений. Описательная статистика: среднее значение, математическое ожидание, медиана, мода, дисперсия, среднее квадратичное отклонение, коэффициент вариации, показатель точности опыта, минимум, максимум, размах выборки, моменты распределения. Вариационная статистика: параметры классовых интервалов, группировка, функции эмпирического распределения. Ранжирование. Проверка случайности выборки из нормальной совокупности. Статистические гипотезы и статистические критерии. Характеристики критериев. Тест Вальда. Тест Стьюдента. Лемма Неймана-Пирсона. Критерий отношения правдоподобия. Введение в A/B-тестирование. Критерий последовательного отношения правдоподобия. Непараметрические критерии.
- Корреляционный анализ данныхПарный коэффициент корреляции. Проверка гипотезы о значимости коэффициента корреляции. Доверительный интервал для парного коэффициента корреляции. Частный коэффициент корреляции. Проверка гипотезы о значимости частного коэффициента корреляции. Множественный коэффициент корреляции. Проверка гипотезы о значимости множественного коэффициента корреляции. Корреляционный анализ качественных данных. Исследование связи между номинальными переменными (таблица сопряженности признаков, критерий хи-квадрат, меры связи признаков
- Методы классификации многомерных наблюденийКлассификация многомерных наблюдений без обучения (непараметрический случай), кластерный анализ. Классификация многомерных наблюдений при наличии обучающих выборок, дискриминантный анализ. Классификация многомерных наблюдений без обучения (параметрический случай), расщепление смесей вероятностных распределений. Канонические корреляции.
- Регрессионный анализАнализ однофакторной регрессионной модели нелинейной регрессионной модели. Анализ общей линейной модели наблюдений при классических предположениях Анализ линейной модели наблюдений при отклонениях от классических предположений
Промежуточная аттестация
- Промежуточная аттестация (4 модуль)0.2 * Домашняя работа + 0.1 * Контактная работа + 0.2 * Контрольная работа + 0.1 * Самостоятельная работа + 0.4 * Экзамен
Список литературы
Рекомендуемая основная литература
- Под ред. Мхитаряна В.С. - АНАЛИЗ ДАННЫХ. Учебник для академического бакалавриата - М.:Издательство Юрайт - 2019 - 490с. - ISBN: 978-5-534-00616-2 - Текст электронный // ЭБС ЮРАЙТ - URL: https://urait.ru/book/analiz-dannyh-432178
Рекомендуемая дополнительная литература
- Демидова О. А., Малахов Д. И. - ЭКОНОМЕТРИКА. Учебник и практикум для прикладного бакалавриата - М.:Издательство Юрайт - 2019 - 334с. - ISBN: 978-5-534-00625-4 - Текст электронный // ЭБС ЮРАЙТ - URL: https://urait.ru/book/ekonometrika-432950
- Эконометрика. Практикум: Учебное пособие/Бородич С. А. - М.: НИЦ ИНФРА-М, Нов. знание, 2015. - 329 с.: 60x90 1/16. - (Высшее образование: Бакалавриат) ISBN 978-5-16-009429-8 - Режим доступа: http://znanium.com/catalog/product/502332