• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта
Бакалавриат 2020/2021

Открытые данные в цифровой среде: поиск, обработка и визуализация

Лучший по критерию «Полезность курса для расширения кругозора и разностороннего развития»
Лучший по критерию «Новизна полученных знаний»
Статус: Курс по выбору (Медиакоммуникации)
Направление: 42.03.05. Медиакоммуникации
Кто читает: Институт медиа
Когда читается: 3-й курс, 1, 2 модуль
Формат изучения: без онлайн-курса
Язык: русский
Кредиты: 4
Контактные часы: 50

Программа дисциплины

Аннотация

В рамках курса студенты научатся разбираться в типах данных, узнают, где и как найти данные, какие данным можно доверять, а каким – нет, как проверить данные. А также узнают, какие инструменты для работы с данными стоит использовать в тех или иных случаях.
Цель освоения дисциплины

Цель освоения дисциплины

  • Познакомить с основами работы с данными.
  • Сформировать навык поиска и обработки данных.
Планируемые результаты обучения

Планируемые результаты обучения

  • Выявляет отличия дата-материала от обычного журналистского материала.
  • Понимаем историю феномена.
  • Отличает обычные данные от больших данных.
  • Отличает типы и форматы данных.
  • Ориентируется в источниках данных.
  • Скрэйпит данные с различных сайтов.
  • Владеет основами анализа данных.
  • Работает в табличных редакторах.
  • Использует основные функций программы Excel.
  • Определяет признаки грязных данных и исправляет их.
  • Описывает и представляет данные.
  • Выбирает правильный тип визуализации данных.
  • Строит карту точек и карту полигонов.
  • Создает историю на основе данных.
  • Использует инструменты создания дата-историй.
Содержание учебной дисциплины

Содержание учебной дисциплины

  • Что такое дата журналистика.
    Определение. Отличие от традиционной журналистики. Разбор дата-журналистских материалов. Предпосылки появления направления.
  • История дата-журналистики.
    Основные этапы становления журналистики данных.
  • Что такое данные.
    Определение. Понятие “большие данные». Отличия данных и информации. Свойства данных. Определение «датасет».
  • Типы и форматы данных.
    Основные типы переменных. Форматы данных, их основные отличия.
  • Получение данных.
    Источники данных: государственные, коммерческие, общественные. Основные порталы открытых данных. Краудсорсинг данных. Основы скрейпинга данных.
  • Очистка данных.
    Признаки грязных данных. Инструменты очистки данных. Практика по очистке данных.
  • Основы статистики.
    Определение статистики. Генеральная совокупность, выборка. Основы описательных статистик.
  • Анализ данных. Гипотезы.
    Выбор темы для дата-материала. Алгоритм формулировки гипотез. Практика по формулировании гипотез.
  • Анализ данных. Ексель.
    Основные функции табличного редактора. Сводные таблицы. Формулы.
  • Визуализация данных.
    Основы визуализации данных. Алгоритм выбора типа визуализации данных. Инструменты создания визуализаций.
  • Картография.
    Основные виды карт. Принципы создания карт. Основные ошибки при создании карт. Инструменты создания карт.
  • Дата-истории.
    Принципы формирования дата-истории. Дата-репортаж и дата-интервью.
  • Форматы дата-историй.
    Типы дата-историй. Инструменты создания дата-историй.
Элементы контроля

Элементы контроля

  • неблокирующий Семинары
  • неблокирующий Тест
  • неблокирующий Итоговый проект
Промежуточная аттестация

Промежуточная аттестация

  • Промежуточная аттестация (2 модуль)
    0.4 * Итоговый проект + 0.3 * Семинары + 0.3 * Тест
Список литературы

Список литературы

Рекомендуемая основная литература

  • Gray, J., Bounegru, L., & Chambers, L. (2012). The Data Journalism Handbook. Europe, Europe: O’Reilly Media. https://doi.org/10.5281/zenodo.1281347

Рекомендуемая дополнительная литература

  • Hector Guerrero. (2019). Excel Data Analysis. Springer. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsrep&AN=edsrep.b.spr.sprbok.978.3.030.01279.3