2023/2024





Методы интерпретации и визуализации данных
Статус:
Маго-лего
Кто читает:
Департамент информатики
Когда читается:
2, 3 модуль
Охват аудитории:
для своего кампуса
Преподаватели:
Зверев Светослав Игоревич
Язык:
русский
Кредиты:
6
Контактные часы:
72
Программа дисциплины
Аннотация
Цель курса - дать слушателям основные инструменты для того, чтобы уметь критически анализировать результаты исследований, уметь описывать, визуализировать и презентовать данные. Студенты познакомятся с языком R - универсальным инструментом анализа и визуализации данных и машинного обучения, обладающим большим и дружелюбным сообществом. Будут освоены методы обработки данных разных типов (чисел, категорий, строк, дат), создания полезных визуализаций результатов и эффективные воспроизводимые отчёты и интерактивные презентации. В результате освоения курса студенты будут способны быстро и эффективно провести исследование данных, графически исследовать ключевые закономерности и представить их в виде интерактивного отчета или дашборда, построить базовые предсказательные модели.
Цель освоения дисциплины
- Формирование у слушателей знаний относительно методов и подходов к анализу и представлению данных.
- Формирование у слушателей знаний о синтаксисе, основных объектах и функциях языка R.
- Формирование навыка анализа и визуализации данных с помощью функционала языка R.
Планируемые результаты обучения
- Визуализирует имеющуюся информацию с помощью различных инструментов.
- Применять основные методы анализа данных в математической статистике и машинном обучении.
- Подбирает наиболее подходящий инструмент анализа данных в соответствие с практической целесообразностью.
- Воспроизводит основы синтаксиса, перечень основных объектов и функций в языке R.
- Определяет параметры данных, значимых для проведения анализа данных.
- Воспроизводит основные методы анализа данных в математической статистике и машинном обучении.
- Интерпретирует наиболее эффективный инструмент анализа данных исходя из структуру данных и поставленной задачи.
- Анализирует значимые (интегральные) параметры данных исходя из структуры данных и поставленной задачи.
- Формирует отчетность по итогам анализа данных.
- Располагает навыком написания на языке R кода, реализующего следующие действия: создания объектов, загрузка данных, обработка данных, корректировка данных, анализ полученных данных, визуализация данных, представление полученных данных.
- Располагает навыком решения практического задания (кейса) от этапа анализа структуры данных, отрасли экономики, к которым эти данные относятся, до загрузки, обработки и выдачи на основании данных результата в виде рекомендации по принятию управленческого решения.
Содержание учебной дисциплины
- Тема 1. Вводное занятие
- Тема 2. Методы математической статистики для анализа данных.
- Тема 3. Методы машинного обучения для анализа данных
- Тема 4. Выбор значимых параметров при анализе данных
- Тема 5. Демонстрация практических примеров анализа данных
- Тема 6. Препроцессинг данных
- Тема 7. Интерполяция и экстраполяция данных
- Тема 8. Сглаживание данных
- Тема 9. Графическое представление данных
- Тема 10. Формирование отчетности по итогам анализа данных
- Тема 11. Синтаксис языка R, основные объекты данных в R
- Тема 12. Загрузка данных в языке R
- Тема 13. Условный оператор в языке R
- Тема 14. Циклы в языке R
- Тема 15. Математические операции в языке R
- Тема 16. Практическая проектная работа
Элементы контроля
- Посещаемость занятийВ рамках курса планируется 14 занятий. За каждое посещенное занятие студент получает 1/10 балла. Если студент пропустил занятие по болезни, оно исключается из расчета и не учитывается при подсчете балла (то есть общий балл делится на меньшее количество занятий).
- Активность на занятияхЗа активное участие в ходе семинара: ответы, комментарии, помощь в написании программ, студент получаете балл. За каждый активный семинар студент получает 1/10 балла.
- Домашнее заданиеВ рамках курса будет изучено пять тем. По каждой теме требуется выполнить домашнее задание. За каждое из заданий студент может максимально получить 0.5 балла
- Промежуточный контрольПо итогу изучения каждой из пяти тем курса, студентам будет представлен тест как форма промежуточного контроля. За каждый тест студент может максимально получить 0.5 балла.
- Итоговый проектПо итогу освоения курса студент может сдать зачетную контрольную работу, либо выполнить в течение семестра курсовой проект, создание которого позволит получить положительную оценку за зачетное мероприятие. Максимально за созданный проект или сданный зачет Вы сможете получить 2 балла.
Промежуточная аттестация
- 2023/2024 учебный год 3 модульМаксимум за курс - 10 баллов. Посещение занятий – 1.4 балла Активность на занятиях – 1.4 балла Домашние задания – 2.5 балла Промежуточный контроль – 2.5 балла Итоговый проект/зачет – 2.2 балла
Список литературы
Рекомендуемая основная литература
- Long, J. D., & Teetor, P. (2019). R Cookbook : Proven Recipes for Data Analysis, Statistics, and Graphics: Vol. Second edition. O’Reilly Media.
- Wickham, H. (2015). Advanced R, Second Edition. Boca Raton, FL: Chapman and Hall/CRC. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=934735
- Wickham, H., & Grolemund, G. (2016). R for Data Science : Import, Tidy, Transform, Visualize, and Model Data (Vol. First edition). Sebastopol, CA: Reilly - O’Reilly Media. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=1440131
Рекомендуемая дополнительная литература
- Приходько, М. А. Математическая статистика и анализ данных / М. А. Приходько, А. В. Приходько. — Омск : Омский ГАУ, 2014. — 60 с. — ISBN 978-5-89764-460-5. — Текст : электронный // Лань : электронно-библиотечная система. — URL: https://e.lanbook.com/book/60684 (дата обращения: 00.00.0000). — Режим доступа: для авториз. пользователей.