Бакалавриат
2020/2021
Открытые данные в цифровой среде: поиск, обработка и визуализация
Лучший по критерию «Полезность курса для расширения кругозора и разностороннего развития»
Лучший по критерию «Новизна полученных знаний»
Статус:
Курс по выбору (Медиакоммуникации)
Направление:
42.03.05. Медиакоммуникации
Кто читает:
Институт медиа
Где читается:
Факультет креативных индустрий
Когда читается:
3-й курс, 1, 2 модуль
Формат изучения:
без онлайн-курса
Преподаватели:
Дресвянин Андрей Валентинович
Язык:
русский
Кредиты:
4
Контактные часы:
50
Программа дисциплины
Аннотация
В рамках курса студенты научатся разбираться в типах данных, узнают, где и как найти данные, какие данным можно доверять, а каким – нет, как проверить данные. А также узнают, какие инструменты для работы с данными стоит использовать в тех или иных случаях.
Цель освоения дисциплины
- Познакомить с основами работы с данными.
- Сформировать навык поиска и обработки данных.
Планируемые результаты обучения
- Выявляет отличия дата-материала от обычного журналистского материала.
- Понимаем историю феномена.
- Отличает обычные данные от больших данных.
- Отличает типы и форматы данных.
- Ориентируется в источниках данных.
- Скрэйпит данные с различных сайтов.
- Владеет основами анализа данных.
- Работает в табличных редакторах.
- Использует основные функций программы Excel.
- Определяет признаки грязных данных и исправляет их.
- Описывает и представляет данные.
- Выбирает правильный тип визуализации данных.
- Строит карту точек и карту полигонов.
- Создает историю на основе данных.
- Использует инструменты создания дата-историй.
Содержание учебной дисциплины
- Что такое дата журналистика.Определение. Отличие от традиционной журналистики. Разбор дата-журналистских материалов. Предпосылки появления направления.
- История дата-журналистики.Основные этапы становления журналистики данных.
- Что такое данные.Определение. Понятие “большие данные». Отличия данных и информации. Свойства данных. Определение «датасет».
- Типы и форматы данных.Основные типы переменных. Форматы данных, их основные отличия.
- Получение данных.Источники данных: государственные, коммерческие, общественные. Основные порталы открытых данных. Краудсорсинг данных. Основы скрейпинга данных.
- Очистка данных.Признаки грязных данных. Инструменты очистки данных. Практика по очистке данных.
- Основы статистики.Определение статистики. Генеральная совокупность, выборка. Основы описательных статистик.
- Анализ данных. Гипотезы.Выбор темы для дата-материала. Алгоритм формулировки гипотез. Практика по формулировании гипотез.
- Анализ данных. Ексель.Основные функции табличного редактора. Сводные таблицы. Формулы.
- Визуализация данных.Основы визуализации данных. Алгоритм выбора типа визуализации данных. Инструменты создания визуализаций.
- Картография.Основные виды карт. Принципы создания карт. Основные ошибки при создании карт. Инструменты создания карт.
- Дата-истории.Принципы формирования дата-истории. Дата-репортаж и дата-интервью.
- Форматы дата-историй.Типы дата-историй. Инструменты создания дата-историй.
Промежуточная аттестация
- Промежуточная аттестация (2 модуль)0.4 * Итоговый проект + 0.3 * Семинары + 0.3 * Тест
Список литературы
Рекомендуемая основная литература
- Gray, J., Bounegru, L., & Chambers, L. (2012). The Data Journalism Handbook. Europe, Europe: O’Reilly Media. https://doi.org/10.5281/zenodo.1281347
Рекомендуемая дополнительная литература
- Hector Guerrero. (2019). Excel Data Analysis. Springer. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsrep&AN=edsrep.b.spr.sprbok.978.3.030.01279.3