• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта
2023/2024

Цифровая архивация современности. Веб-архивы, большие данные и их применение в исследовательской работе

Лучший по критерию «Полезность курса для Вашей будущей карьеры»
Лучший по критерию «Полезность курса для расширения кругозора и разностороннего развития»
Лучший по критерию «Новизна полученных знаний»
Статус: Маго-лего
Когда читается: 1, 2 модуль
Охват аудитории: для всех кампусов НИУ ВШЭ
Преподаватели: Орлова Ксения Викторовна
Язык: русский
Кредиты: 6
Контактные часы: 32

Программа дисциплины

Аннотация

Дисциплина предполагает углубленное изучение источников данных для академических исследований с помощью цифровых методов. Среди тем: форматы и платформы для хранения открытых данных, законодательство и сложившиеся практики в сфере открытых данных, способы сохранения данных в теоретическом и практическом аспекте, распространенные программные решения, сообщество активистов открытых данных, этика хранения и репрезентации данных. Исчезновение данных ("протухание" ссылок) в интернете - проблема, с которой знакомы все активные пользователи сети. Из области видимости могут исчезнуть не только документы далекого прошлого, но и свидетельства того, что происходит на наших глазах. Как эта проблема решается сообществом интернет-активистов и университетской средой? Какие потенциальные проблемы могут порождать существующие решения? Об этом детально и подробно рассказывается в курсе цифровой архивации современности.
Цель освоения дисциплины

Цель освоения дисциплины

  • уметь работать с веб-архивами
  • уметь работать с большими данными
  • применять методы работы с большими данными в исследовательской работе
Планируемые результаты обучения

Планируемые результаты обучения

  • владеет навыками практической работы с данными и решения прикладных задач анализа и визуализации данных
  • знает об особенностях данных и принципах работы современных технологий в гуманитарных дисциплинах
  • умеет анализировать результаты квантитативного анализа
  • умеет использовать открытые ресурсы со структурированными данными
  • умеет использовать формальные и точные методы применительно к избранной сфере
  • Понимает работу онлайн-архивов и методов их анализа в исследовательской деятельности.
Содержание учебной дисциплины

Содержание учебной дисциплины

  • Тема 9. Как изучать: работа с веб-архивами и интервью
  • Основы работы с данными: данные, большие данные, машинное обучение
  • Введение в большие данные - идеи, технологии, методы и области применения.
Элементы контроля

Элементы контроля

  • неблокирующий домашние задания и практическая работа на семинаре
  • неблокирующий экзамен
Промежуточная аттестация

Промежуточная аттестация

  • 2023/2024 учебный год 2 модуль
    0.6 * домашние задания и практическая работа на семинаре + 0.4 * экзамен
Список литературы

Список литературы

Рекомендуемая основная литература

  • Мастицкий, С. Э. Статистический анализ и визуализация данных с помощью R / С. Э. Мастицкий, В. К. Шитиков. — Москва : ДМК Пресс, 2015. — 496 с. — ISBN 978-5-97060-301-7. — Текст : электронный // Лань : электронно-библиотечная система. — URL: https://e.lanbook.com/book/73072 (дата обращения: 00.00.0000). — Режим доступа: для авториз. пользователей.

Рекомендуемая дополнительная литература

  • Create to learn : introduction to digital literacy, Hobbs, R., 2017
  • Introduction to R. (2016). France, Europe: HAL CCSD. https://doi.org/10.1051/eas/1677002