2024/2025
Инструменты и программные средства анализа данных
Статус:
Маго-лего
Кто читает:
Департамент статистики и анализа данных
Когда читается:
2, 3 модуль
Охват аудитории:
для своего кампуса
Преподаватели:
Кузин Сергей Сергеевич
Язык:
русский
Кредиты:
6
Контактные часы:
60
Программа дисциплины
Аннотация
Данный курс предназначен для формирования практических навыков анализа данных с возможностью ориентации среди большого количества имеющихся программных средств для обработки и анализа данных. В курсе дается обзор основных задач обработки данных и примеров различных классов программных средств, используемых в задачах обработки и анализа данных. Особое внимание в курсе уделяется получение студентами практических навыков выполнения всех этапов подготовки и преобразования данных, обнаружения аномалий, получения статистических характеристик данных и исследования зависимостей, настройки и оценки качества моделей
Цель освоения дисциплины
- Целью освоения дисциплины является знание основных задач, принципов и приемов работы с данными, знание и умение применения программных средств работы с данными для выполнения преобразований данных, анализа данных и представления результатов анализа.
Планируемые результаты обучения
- Знает задачи работы с данными и виды результатов, получаемых в процессе обработки и анализа данных
- Знает основные принципы построения прогностических моделей и обладает навыками построения и применения моделей
- Знает основные формы представления данных
- Знает основные функциональные возможности программных средств работы с данными и умеет проводить их сравнение
- Знает принципы использования выборок в анализе данных и умеет их извлекать
- Умеет выполнять аудит данных, выявлять аномалии и пропуски в данных, применять методы обработки аномальных и пропущенных значений
- Умеет выполнять визуальный анализ категориальных и количественных данных
- Умеет выполнять преобразования данных в соответствии с поставленными задачами анализа данных
- Умеет обращаться с временным и рядами данных, выполнять анализ и прогнозирование временных рядов показателей
- Умеет объединять данные из различных таблиц в соответствии с задачами анализа данных
- Умеет оценивать качество и устойчивость прогностических моделей
- Умеет получать основные описательные статистики наборов данных, а также зависимостей между переменными
- Умеет представлять результаты анализа данных в виде таблиц и графических результатов
- Знать задачи работы с данными и виды результатов, получаемых в процессе обработки и анализа данных
- Уметь выполнять преобразования данных в соответствии с поставленными задачами анализа данных
Содержание учебной дисциплины
- Задачи и программные средства работы с данными
- Преобразование, аудит данных и подготовка к анализу
- Анализ данных, построение моделей
- Работа с временными рядами данных
Элементы контроля
- Контрольная работа
- Домашнее задание 1Домашнее задание 1
- Домашнее задание 2Домашнее задание 2
- Домашнее задание
- Домашнее задание
- Контрольная работа
- Домашнее задание
- Клнтрольная работа
- Домашнее задание
- Домашнее задание
- Домашнее задание
- Клнтрольная работа
- Аудиторная активностьАудиторная активность
Промежуточная аттестация
- 2024/2025 3rd module0.25 * Аудиторная активность + 0 * Домашнее задание + 0 * Домашнее задание + 0 * Домашнее задание + 0 * Домашнее задание + 0 * Домашнее задание + 0 * Домашнее задание + 0 * Домашнее задание + 0 * Домашнее задание + 0 * Домашнее задание + 0.25 * Домашнее задание 1 + 0.25 * Домашнее задание 2 + 0 * Клнтрольная работа + 0 * Клнтрольная работа + 0.25 * Контрольная работа + 0 * Контрольная работа
Список литературы
Рекомендуемая основная литература
- Advanced data mining techniques, Olson, D. L., 2008
- Kantardzic, M., & Recorded Books, I. (2019). Data Mining : Concepts, Models, Methods, and Algorithms (Vol. Third edition). [Place of publication not identified]: Wiley-IEEE Press. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=2282578
- Meyers, L. S. (2013). Performing Data Analysis Using IBM SPSS. Hoboken: Wiley. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=610849
- Rifà Ros, E. X. (2006). FIELD, A. (2005). Discovering Statistics Using SPSS. London: SAGE Publications. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsrac&AN=edsrac.97589
- Груздев, А. В. Прогнозное моделирование в IBM SPSS Statistics и R: Метод деревьев решений : руководство / А. В. Груздев. — Москва : ДМК Пресс, 2016. — 278 с. — ISBN 978-5-97060-456-4. — Текст : электронный // Лань : электронно-библиотечная система. — URL: https://e.lanbook.com/book/93280 (дата обращения: 00.00.0000). — Режим доступа: для авториз. пользователей.
- Роберт, И. R в действии. Анализ и визуализация данных в программе R : руководство / И. Роберт, Кабаков , перевод с английского Полины А. Волковой. — Москва : ДМК Пресс, 2014. — 588 с. — ISBN 978-5-97060-077-1. — Текст : электронный // Лань : электронно-библиотечная система. — URL: https://e.lanbook.com/book/58703 (дата обращения: 00.00.0000). — Режим доступа: для авториз. пользователей.
Рекомендуемая дополнительная литература
- Sarkar, D., Bali, R., & Sharma, T. (2018). Practical Machine Learning with Python : A Problem-Solver’s Guide to Building Real-World Intelligent Systems. [United States]: Apress. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=1667293
- Squire, M. (2016). Mastering Data Mining with Python – Find Patterns Hidden in Your Data. Birmingham: Packt Publishing. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=1343887