Бакалавриат
2021/2022
Основы работы с данными: сбор, анализ, визуализация
Статус:
Курс обязательный (Журналистика)
Направление:
42.03.02. Журналистика
Где читается:
Факультет креативных индустрий
Когда читается:
3-й курс, 1, 2 модуль
Формат изучения:
с онлайн-курсом
Онлайн-часы:
50
Охват аудитории:
для своего кампуса
Преподаватели:
Быков Кирилл Валерьевич,
Карпов Максим Евгеньевич,
Максимовская Анастасия Максимовна,
Перевышина Татьяна Олеговна
Язык:
русский
Кредиты:
3
Контактные часы:
38
Программа дисциплины
Аннотация
Умение понимать, интерпретировать и презентовать данные является важным навыком в современном мире. Целью данного курса является дать слушателям основные инструменты для того, чтобы уметь критически анализировать результаты исследований, а также уметь описывать, визуализировать и презентовать такую информацию. Курс можно разбить на две части. В первой части мы научимся собирать данные с новостных сайтов (по определенной тематике или отрасли), формировать из них базу статей в виде таблицы и затем будем учиться работать с табличными данными – загружать и обрабатывать их, заполнять пропуски, считать описательные статистики. Вторая часть курса посвящена визуализации данных. Мы поговорим о том, как строить наглядные графики, как делать наши визуализации более эффективными и избегать искажения информации. Задание по сбору статей в рамках своей исследовательской задачи в журналистике, последующей их обработке и визуализации данных и защита полученного продукта в виде аналитической заметки станут финальным проектом курса.
Цель освоения дисциплины
- Развитие и закрепление базовых навыков программирования на языке Python.
- Формирование и развитие навыков работы со специализированными библиотеками для сбора, обработки, визуализации и анализа данных (bs4, pandas, matplotlib, seaborn, plotly).
- Развитие у студентов навыка чтения, интерпретации и оценки качества анализа и представления количественных данных.
- Формирование навыка оценки качества визуализации данных и ее корректности.
- Развитие навыков постановки исследовательской задачи и их решение с помощью количественных методов.
Планируемые результаты обучения
- Выбирать корректный вид визуализации для данных
- Замечать ошибки, допущенные при визуализации данных (искажение трендов и информации и т.д.) и избегать их при создании своих визуализаций
- Знать главные когнитивные особенности восприятия визуальной информации и опираться на них при создании визуализаций
- Интерпретировать результаты простых экспериментальных исследований и опросов
- Корректно понимать основную статистическую терминологию
- Работать с табличными данными в редакторах (Google Таблицы), уметь манипулировать данными, создавать новые переменные
- Различать и интерпретировать базовые описательные статистики, виды переменных
- Различать плохие примеры визуализации данных и уметь обосновывать свое мнение
- Создавать визуализации количественных данных с помощью Tableau
- Считать базовые описательные статистики (меры центральности, разброса и т.д.)
- Уметь оценивать корректность использования тех или иных статистических понятий в отчетах и публикациях
Содержание учебной дисциплины
- Введение в статистику и работу с данными
- Визуализация данных: особенности восприятия, лучшие практики и ошибки
- Практика по визуализации данных в Tableau
- Повторение основ программирования на Python
Элементы контроля
- Онлайн-курс
- Домашние задания
- Тесты на лекциях
- ЭкзаменЭкзамен проводится с применением прокторинга.
- Проект
- Работа на семинарах
Промежуточная аттестация
- 2021/2022 учебный год 2 модульВсего можно набрать за курс 11 баллов, но выставляется по итогу оценка не выше 10. Итог = Минимум (10, 0.1 * Онлайн курс + 0.1 * Работа на семинарах + 0.1 * Тесты на лекциях + 0.1 * ДЗ 1 + 0.1 * ДЗ 2 + 0.1 * ДЗ 3 + 0.1 * ДЗ 4 + 0.1 * ДЗ 5 + 0.15 * Проект + 0.15 * Экзамен)
Список литературы
Рекомендуемая основная литература
- Anoshin, D., Matic, T., Bogdanovic, S., Lincoln, T., & Shirokov, D. (2019). Tableau 2019.x Cookbook : Over 115 Recipes to Build End-to-end Analytical Solutions Using Tableau. Birmingham: Packt Publishing. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=2022993
- Python for data analysis : data wrangling with pandas, numPy, and IPhython, Mckinney, W., 2017
- Yau, N. (2013). Data Points : Visualization That Means Something. New York: Wiley. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=566405
- Математико - статистические модели в социологии : математическая статистика для социологов: учеб. пособие, Толстова, Ю. Н., 2007
Рекомендуемая дополнительная литература
- Joshua N. Milligan. (2019). Learning Tableau 2019 : Tools for Business Intelligence, Data Prep, and Visual Analytics, 3rd Edition. Birmingham: Packt Publishing. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=2092866
- Митчелл, Р. Скрапинг веб-сайтов с помощю Python : руководство / Р. Митчелл ; перевод с английского А. В. Груздев. — Москва : ДМК Пресс, 2016. — 280 с. — ISBN 978-5-97060-223-2. — Текст : электронный // Лань : электронно-библиотечная система. — URL: https://e.lanbook.com/book/100903 (дата обращения: 00.00.0000). — Режим доступа: для авториз. пользователей.