2020/2021
Приложения и практика анализа данных
Лучший по критерию «Полезность курса для расширения кругозора и разностороннего развития»
Лучший по критерию «Новизна полученных знаний»
Статус:
Майнор
Кто читает:
Департамент математики
Когда читается:
3, 4 модуль
Преподаватели:
Бусуркина Ирина Петровна,
Мусабиров Илья Леонидович,
Сироткин Александр Владимирович,
Суворова Алёна Владимировна,
Чуприна Дарья Викторовна
Язык:
русский
Кредиты:
5
Контактные часы:
60
Программа дисциплины
Аннотация
Курс посвящен более глубокому погружению студентов в специализированную область анализа данных и выполнение итогового практического проекта с использованием всех компетенций, приобретённых в процессе освоения майнора Data Science. Учитывая междисциплинарную важность майнора, в рамках базовой структуры и требований курса Applications and Practice of Data Science могут быть реализованы проекты из различных направлений и предметных областей. В рамках курса студентам будут предложены групповые и индивидуальные проекты, а так же возможность предложить собственный проект.
Цель освоения дисциплины
- Целями освоения дисциплины «Приложения и практика анализа данных» являются изучение особенностей разработки приложений и сервисов построенных на основе методов анализа данных, особенностей совместной разработки, разработки пользовательского интерфейса и работы с системами контроля версий.
Планируемые результаты обучения
- Формулирует задачу построения системы рекомендаций на основе заданного или самостоятельно подобранного набора данных
- Внедряет алгоритмы построения рекомендаций в аналитические сервисы
- Проектирует интерфейсы приложений средствами языка R
- Строит интерактивные визуализации средствами языка R
- Автоматизирует сбор и анализ информации из различных источников в глобальных компьютерных сетях
- Планирует самостоятельную работу при выполнении группового проекта
- Владеет инструментами совместной разработки
Содержание учебной дисциплины
- Создание пользовательского интерфейсаВведение в html, основные элементы веб-интерфейса. Взаимодействие с пользователем. Архитектура приложений на Shiny. Элементы пользовательского интерфейса: создание и обработка взаимодействий. Интерактивные визуализации
- Рекомендательные системыСоздание рекомендательных систем на основе рейтингов товаров. Коллаборативная фильтрация по пользователям (user-based) и по товарам (item-based). Альтернативные методы формирования рекомендаций (SVM разложение, рекомендации наиболее популярных товаров). Машинное обучение в рекомендательных системах. Оценки качества рекомендаций, на основе оценки точности восстанавливаемых рейтингов. Оценки качества рекомендаций, на основе решения задачи бинарной классификации на подходящие и не подходящие рекомендации.
- Работа над коллективными проектамиОсновы работы с системой контроля версий git и сервисом github.com. Применение системы контроля версий в среде разработки RStudio. Основы совместной работы над общим проектом. Выбор направления проекта и подготовка плана работы. Выполнение учебного проекта. Промежуточная и итоговая защита проекта. Подготовка отчета. Презентация результатов
Элементы контроля
- Дневники проектаДневники работы над проектом представляют собой регулярные письменные отчеты о прогрессе в выполнении проекта. Дневники заполняются в виде комментария в ветке проекта.
- Защита идеиВидео на 3-5 минут с описанием идеи, ролей в команде и основных положений из canvas (ожидаемые сценарии, функциональность, данные, пользователи, оценивание, интерфейс). Записывается с участием всех членов команды
- Защита проекта с демонстрациейГрупповая презентация результатов проекта, включая демонстрацию работы сервиса (в формате видеозаписи на 7-10 минут) + ссылка на работающее приложение Обязательными разделами доклада являются: 1. Общее описание идеи сервиса 2. Описание данных 3. Состав команды и распределение ролей 4. Использованные методы анализа 5. Демонстрация примеров работы проекта 6. Оценивание разработанной системы. 7. Возникшие в процессе выполнения проекта сложности, изменения исходной идеи
- ОтчетСтруктурированный письменный отчет по проекту с ответами на вопросы, полученные во время взаимного оценивания и от преподавателей во время проверки.
- Схема (canvas) проектаСхематичное описание проекта по представленному шаблону (сфера, цели, функциональность, методы, интрефейс, оценивание)
- Взаимное оценивание идеиКаждый студент индивидуально оценивает видео-презентации трех проектов (два по предварительному распределению, один по выбору студента). Для каждого проекта дается общая оценка, формулируются вопросы, даются рекомендации по улучшению, дополнению или изменению, а также приводятся примеры, на которых хотелось бы проверить рекомендательную систему.
- Взаимное оценивание проектовКаждый студент индивидуально оценивает видео-презентации трех проектов (два по предварительному распределению, один по выбору студента). Для каждого проекта дается общая оценка, формулируются вопросы, приводятся примеры сценариев, на которых хотелось бы проверить рекомендательную систему.
- Ответы на вопросы по проектуОтветы на индивидуальные вопросы по проекту, полученные от преподавателей во время проверки.
Промежуточная аттестация
- Промежуточная аттестация (4 модуль)0.05 * Взаимное оценивание идеи + 0.1 * Взаимное оценивание проектов + 0.2 * Дневники проекта + 0.05 * Защита идеи + 0.2 * Защита проекта с демонстрацией + 0.15 * Ответы на вопросы по проекту + 0.2 * Отчет + 0.05 * Схема (canvas) проекта
Список литературы
Рекомендуемая основная литература
- Munzert S. Automated data collection with R: a practical guide to Web scraping and text mining. Chichester, West Sussex, United Kingdom: Wiley, 2014. 1 p.
- Siegel, E. (2016). Predictive Analytics : The Power to Predict Who Will Click, Buy, Lie, or Die (Vol. Revised and Updated edition). Hoboken: Wiley. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=1157317
- Под ред. Мхитаряна В.С. - АНАЛИЗ ДАННЫХ. Учебник для академического бакалавриата - М.:Издательство Юрайт - 2019 - 490с. - ISBN: 978-5-534-00616-2 - Текст электронный // ЭБС ЮРАЙТ - URL: https://urait.ru/book/analiz-dannyh-432178
Рекомендуемая дополнительная литература
- James, G. et al. An introduction to statistical learning. – Springer, 2013. – 426 pp.
- Ledolter, J. (2013). Data Mining and Business Analytics with R. Hoboken, New Jersey: Wiley. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=587979
- Zhao, Y., & Cen, Y. (2013). Data Mining Applications with R. Amsterdam: Academic Press. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=543675