2023/2024
Инструменты и программные средства анализа данных
Статус:
Маго-лего
Кто читает:
Департамент статистики и анализа данных
Когда читается:
2, 3 модуль
Охват аудитории:
для своего кампуса
Преподаватели:
Кузин Сергей Сергеевич
Язык:
русский
Кредиты:
6
Контактные часы:
60
Программа дисциплины
Аннотация
Данный курс предназначен для формирования практических навыков анализа данных с возможностью ориентации среди большого количества имеющихся программных средств для обработки и анализа данных. В курсе дается обзор основных задач обработки данных и примеров различных классов программных средств, используемых в задачах обработки и анализа данных. Особое внимание в курсе уделяется получение студентами практических навыков выполнения всех этапов подготовки и преобразования данных, обнаружения аномалий, получения статистических характеристик данных и исследования зависимостей, настройки и оценки качества моделей
Цель освоения дисциплины
- Целью освоения дисциплины является знание основных задач, принципов и приемов работы с данными, знание и умение применения программных средств работы с данными для выполнения преобразований данных, анализа данных и представления результатов анализа.
Планируемые результаты обучения
- Знает задачи работы с данными и виды результатов, получаемых в процессе обработки и анализа данных
- Знает основные принципы построения прогностических моделей и обладает навыками построения и применения моделей
- Знает основные формы представления данных
- Знает основные функциональные возможности программных средств работы с данными и умеет проводить их сравнение
- Знает принципы использования выборок в анализе данных и умеет их извлекать
- Умеет выполнять аудит данных, выявлять аномалии и пропуски в данных, применять методы обработки аномальных и пропущенных значений
- Умеет выполнять визуальный анализ категориальных и количественных данных
- Умеет выполнять преобразования данных в соответствии с поставленными задачами анализа данных
- Умеет обращаться с временным и рядами данных, выполнять анализ и прогнозирование временных рядов показателей
- Умеет объединять данные из различных таблиц в соответствии с задачами анализа данных
- Умеет оценивать качество и устойчивость прогностических моделей
- Умеет получать основные описательные статистики наборов данных, а также зависимостей между переменными
- Умеет представлять результаты анализа данных в виде таблиц и графических результатов
- Знать задачи работы с данными и виды результатов, получаемых в процессе обработки и анализа данных
- Уметь выполнять преобразования данных в соответствии с поставленными задачами анализа данных
Содержание учебной дисциплины
- Задачи и программные средства работы с данными
- Преобразование, аудит данных и подготовка к анализу
- Анализ данных, построение моделей
- Работа с временными рядами данных
- Средства публикации микроданных и онлайн анализа
Промежуточная аттестация
- 2023/2024 учебный год 3 модуль0.25 * Домашнее задание + 0.25 * Домашнее задание + 0.25 * Домашнее задание + 0.25 * Клнтрольная работа
Список литературы
Рекомендуемая основная литература
- Attaway, S. (2012). Matlab : A Practical Introduction to Programming and Problem Solving (Vol. 2nd ed). Amsterdam: Butterworth-Heinemann. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=380478
- Littell, R. C., Schlotzhauer, S. D. SAS System for Elementary Statistical Analysis. – SAS Institute, 1997. – 456 pp.
- Meyers, L. S. (2013). Performing Data Analysis Using IBM SPSS. Hoboken: Wiley. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=610849
- Груздев, А. В. Прогнозное моделирование в IBM SPSS Statistics и R: Метод деревьев решений : руководство / А. В. Груздев. — Москва : ДМК Пресс, 2016. — 278 с. — ISBN 978-5-97060-456-4. — Текст : электронный // Лань : электронно-библиотечная система. — URL: https://e.lanbook.com/book/93280 (дата обращения: 00.00.0000). — Режим доступа: для авториз. пользователей.
- Роберт, И. R в действии. Анализ и визуализация данных в программе R : руководство / И. Роберт, Кабаков , перевод с английского Полины А. Волковой. — Москва : ДМК Пресс, 2014. — 588 с. — ISBN 978-5-97060-077-1. — Текст : электронный // Лань : электронно-библиотечная система. — URL: https://e.lanbook.com/book/58703 (дата обращения: 00.00.0000). — Режим доступа: для авториз. пользователей.
Рекомендуемая дополнительная литература
- Norris, G., Cramer, D., Howitt, D., & Qureshi, F. (2013). Introduction to Statistics with SPSS for Social Science. Abingdon: Routledge. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=960264
- Sarkar, D., Bali, R., & Sharma, T. (2018). Practical Machine Learning with Python : A Problem-Solver’s Guide to Building Real-World Intelligent Systems. [United States]: Apress. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=1667293
- Squire, M. (2016). Mastering Data Mining with Python – Find Patterns Hidden in Your Data. Birmingham: Packt Publishing. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=1343887