Магистратура
2024/2025
Цифровая архивация современности. Веб-архивы, большие данные и их применение в исследовательской работе
Статус:
Курс по выбору (Цифровые методы в гуманитарных науках)
Направление:
45.04.03. Фундаментальная и прикладная лингвистика
Кто читает:
Школа лингвистики
Где читается:
Факультет гуманитарных наук
Когда читается:
2-й курс, 1, 2 модуль
Формат изучения:
без онлайн-курса
Охват аудитории:
для всех кампусов НИУ ВШЭ
Преподаватели:
Орлова Ксения Викторовна
Прогр. обучения:
Цифровые методы в гуманитарных науках
Язык:
русский
Кредиты:
6
Контактные часы:
32
Программа дисциплины
Аннотация
Дисциплина предполагает углубленное изучение источников данных для академических исследований с помощью цифровых методов. Среди тем: форматы и платформы для хранения открытых данных, законодательство и сложившиеся практики в сфере открытых данных, способы сохранения данных в теоретическом и практическом аспекте, распространенные программные решения, сообщество активистов открытых данных, этика хранения и репрезентации данных.
Исчезновение данных ("протухание" ссылок) в интернете - проблема, с которой знакомы все активные пользователи сети. Из области видимости могут исчезнуть не только документы далекого прошлого, но и свидетельства того, что происходит на наших глазах. Как эта проблема решается сообществом интернет-активистов и университетской средой? Какие потенциальные проблемы могут порождать существующие решения? Об этом детально и подробно рассказывается в курсе цифровой архивации современности.
Цель освоения дисциплины
- уметь работать с веб-архивами
- уметь работать с большими данными
- применять методы работы с большими данными в исследовательской работе
Планируемые результаты обучения
- владеет навыками практической работы с данными и решения прикладных задач анализа и визуализации данных
- знает об особенностях данных и принципах работы современных технологий в гуманитарных дисциплинах
- умеет анализировать результаты квантитативного анализа
- умеет использовать открытые ресурсы со структурированными данными
- умеет использовать формальные и точные методы применительно к избранной сфере
- Понимает работу онлайн-архивов и методов их анализа в исследовательской деятельности.
Содержание учебной дисциплины
- Тема 9. Как изучать: работа с веб-архивами и интервью
- Основы работы с данными: данные, большие данные, машинное обучение
- Введение в большие данные - идеи, технологии, методы и области применения.
Промежуточная аттестация
- 2024/2025 учебный год 2 модуль0.6 * домашние задания и практическая работа на семинаре + 0.4 * экзамен
Список литературы
Рекомендуемая основная литература
- Мастицкий, С. Э. Статистический анализ и визуализация данных с помощью R / С. Э. Мастицкий, В. К. Шитиков. — Москва : ДМК Пресс, 2015. — 496 с. — ISBN 978-5-97060-301-7. — Текст : электронный // Лань : электронно-библиотечная система. — URL: https://e.lanbook.com/book/73072 (дата обращения: 00.00.0000). — Режим доступа: для авториз. пользователей.
Рекомендуемая дополнительная литература
- Create to learn : introduction to digital literacy, Hobbs, R., 2017
- Introduction to R. (2016). France, Europe: HAL CCSD. https://doi.org/10.1051/eas/1677002