• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта
Бакалавриат 2021/2022

Основы работы с данными: сбор, анализ, визуализация

Статус: Курс обязательный (Журналистика)
Направление: 42.03.02. Журналистика
Когда читается: 3-й курс, 1, 2 модуль
Формат изучения: с онлайн-курсом
Онлайн-часы: 50
Охват аудитории: для своего кампуса
Преподаватели: Быков Кирилл Валерьевич, Карпов Максим Евгеньевич, Максимовская Анастасия Максимовна, Перевышина Татьяна Олеговна
Язык: русский
Кредиты: 3
Контактные часы: 38

Программа дисциплины

Аннотация

Умение понимать, интерпретировать и презентовать данные является важным навыком в современном мире. Целью данного курса является дать слушателям основные инструменты для того, чтобы уметь критически анализировать результаты исследований, а также уметь описывать, визуализировать и презентовать такую информацию. Курс можно разбить на две части. В первой части мы научимся собирать данные с новостных сайтов (по определенной тематике или отрасли), формировать из них базу статей в виде таблицы и затем будем учиться работать с табличными данными – загружать и обрабатывать их, заполнять пропуски, считать описательные статистики. Вторая часть курса посвящена визуализации данных. Мы поговорим о том, как строить наглядные графики, как делать наши визуализации более эффективными и избегать искажения информации. Задание по сбору статей в рамках своей исследовательской задачи в журналистике, последующей их обработке и визуализации данных и защита полученного продукта в виде аналитической заметки станут финальным проектом курса.
Цель освоения дисциплины

Цель освоения дисциплины

  • Развитие и закрепление базовых навыков программирования на языке Python.
  • Формирование и развитие навыков работы со специализированными библиотеками для сбора, обработки, визуализации и анализа данных (bs4, pandas, matplotlib, seaborn, plotly).
  • Развитие у студентов навыка чтения, интерпретации и оценки качества анализа и представления количественных данных.
  • Формирование навыка оценки качества визуализации данных и ее корректности.
  • Развитие навыков постановки исследовательской задачи и их решение с помощью количественных методов.
Планируемые результаты обучения

Планируемые результаты обучения

  • Выбирать корректный вид визуализации для данных
  • Замечать ошибки, допущенные при визуализации данных (искажение трендов и информации и т.д.) и избегать их при создании своих визуализаций
  • Знать главные когнитивные особенности восприятия визуальной информации и опираться на них при создании визуализаций
  • Интерпретировать результаты простых экспериментальных исследований и опросов
  • Корректно понимать основную статистическую терминологию
  • Работать с табличными данными в редакторах (Google Таблицы), уметь манипулировать данными, создавать новые переменные
  • Различать и интерпретировать базовые описательные статистики, виды переменных
  • Различать плохие примеры визуализации данных и уметь обосновывать свое мнение
  • Создавать визуализации количественных данных с помощью Tableau
  • Считать базовые описательные статистики (меры центральности, разброса и т.д.)
  • Уметь оценивать корректность использования тех или иных статистических понятий в отчетах и публикациях
Содержание учебной дисциплины

Содержание учебной дисциплины

  • Введение в статистику и работу с данными
  • Визуализация данных: особенности восприятия, лучшие практики и ошибки
  • Практика по визуализации данных в Tableau
  • Повторение основ программирования на Python
Элементы контроля

Элементы контроля

  • неблокирующий Онлайн-курс
  • неблокирующий Домашние задания
  • неблокирующий Тесты на лекциях
  • неблокирующий Экзамен
    Экзамен проводится с применением прокторинга.
  • неблокирующий Проект
  • неблокирующий Работа на семинарах
Промежуточная аттестация

Промежуточная аттестация

  • 2021/2022 учебный год 2 модуль
    Всего можно набрать за курс 11 баллов, но выставляется по итогу оценка не выше 10. Итог = Минимум (10, 0.1 * Онлайн курс + 0.1 * Работа на семинарах + 0.1 * Тесты на лекциях + 0.1 * ДЗ 1 + 0.1 * ДЗ 2 + 0.1 * ДЗ 3 + 0.1 * ДЗ 4 + 0.1 * ДЗ 5 + 0.15 * Проект + 0.15 * Экзамен)
Список литературы

Список литературы

Рекомендуемая основная литература

  • Anoshin, D., Matic, T., Bogdanovic, S., Lincoln, T., & Shirokov, D. (2019). Tableau 2019.x Cookbook : Over 115 Recipes to Build End-to-end Analytical Solutions Using Tableau. Birmingham: Packt Publishing. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=2022993
  • Python for data analysis : data wrangling with pandas, numPy, and IPhython, Mckinney, W., 2017
  • Yau, N. (2013). Data Points : Visualization That Means Something. New York: Wiley. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=566405
  • Математико - статистические модели в социологии : математическая статистика для социологов: учеб. пособие, Толстова, Ю. Н., 2007

Рекомендуемая дополнительная литература

  • Joshua N. Milligan. (2019). Learning Tableau 2019 : Tools for Business Intelligence, Data Prep, and Visual Analytics, 3rd Edition. Birmingham: Packt Publishing. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=2092866
  • Митчелл, Р. Скрапинг веб-сайтов с помощю Python : руководство / Р. Митчелл ; перевод с английского А. В. Груздев. — Москва : ДМК Пресс, 2016. — 280 с. — ISBN 978-5-97060-223-2. — Текст : электронный // Лань : электронно-библиотечная система. — URL: https://e.lanbook.com/book/100903 (дата обращения: 00.00.0000). — Режим доступа: для авториз. пользователей.