Магистратура
2021/2022
Научно-исследовательский семинар
Статус:
Курс обязательный (Журналистика данных)
Направление:
42.04.02. Журналистика
Кто читает:
Институт медиа
Где читается:
Факультет креативных индустрий
Когда читается:
2-й курс, 1-3 модуль
Формат изучения:
без онлайн-курса
Охват аудитории:
для своего кампуса
Преподаватели:
Бобринская Мария Алексеевна,
Нестеренко Любовь Владимировна,
Прохоров Артем Вячеславович
Прогр. обучения:
Журналистика данных
Язык:
русский
Кредиты:
12
Контактные часы:
120
Программа дисциплины
Аннотация
Научно-исследовательский семинар изучает научные методы работы в сфере журналистики данных, подробно останавливаясь на изучении и использовании пространственных данных, сетевом анализе, компьютерной лингвистике, а также научных методах исследования, академическом письме и мастерстве представления академического исследования, практики прикладного использования его результатов.
Цель освоения дисциплины
- Обучение студентов с теоретическими основами цифрового картографирования и практическими навыками работы с пространственными данными,использования геоинформационных систем, визуализации и картографического дизайна
- Рассмотрение методов компьютерной лингвистики, применяемых при обработке текстов в предметно-ориентированных информационных системах.
- Изучаются виды используемых лингвистических ресурсов и методы их разработки.
- Рассматриваются задачи автоматического аннотирования тестов, рубрикации и кластеризации текстов, извлечения информации из текстов.
- Дать студентам базовые знания об источниках, методах сбора и нормализации пространственных данных.
- Познакомить студентов с вариантами визуализации географической информации в статическом и интерактивном форматах.
- Научить студентов практическим навыкам первичного ГИС-анализа и интерпретации результатов.
- Научить студентов создавать собственные картографические произведения в веб.
Планируемые результаты обучения
- Владеет методами представления результатов проекта в области сетевого анализа
- Владеет навыками моделирования случайных графов для тестирования статистических гипотез на структурных данных
- Умеет находить структурно схожие элементы и меры схожести в структурной информации
- Умеет обнаруживать сообщества в сетях, владеет методами кластеризации на графах
- Визуализирует атрибутивную информацию пространственных данных
- Владеет методами машинного обучения для структурной модели графа
- Владеет методами машинного обучения для структурной модели графа с учетом текстовых эмбеддингов
- Владеет навыками логико-лингвистического моделирования предметной области с использованием стандартов и инструментальных средств, поддерживающих разработку лингвистического обеспечения информационной системы для конкретной предметной области
- Владеет навыками оценки качества систем автоматической обработки текста
- Владеет навыками текстового анализа при помощи инструментов и библиотек Python
- Владеет терминологией в области картографии и ГИС
- Выбирает виды и источники данных в зависимости от задач
- Выбирает нужные параметры проекций и систем координат
- Делит большие задачи на мелкие подзадачи
- Демонстрирует общие знания об области применения анализа социальный сетей и программных средствам для работы с графами
- Знает инструменты и библиотеки Python для компьютерной лингвистики
- Знает модели распространения влияния. Умеет прогнозировать достижение равновесия в сетевой модели на основе Марковских процессов в сетях
- Знает основные подходы к решению задач компьютерной лингвистики
- Знает основные приложения автоматической обработки текстов, используемые в пред-метно-ориентированных информационных системах
- Знает понятие центральности как меры ранжирования вершин в графе на основе структурной информации
- Знает понятия центральности и престижа как мер ранжирования вершин, взаимовлияние в ориентированных сетях
- Знает статистические особенности реальных сетей, основные отличия реальных сетей от модельных данных
- Извлекает сущности из текста
- Использует инструменты пространственного анализа
- Ориентируется в задачах автоматической обработки текста
- Оценивает работу систем автоматической обработки текста
- Применяет специализированные библиотеки Python для задач автоматической обработки текста
- Решает задачи предобработки текста с использованием приёмом программирования на Python
- Создает законченный проект на основе пространственных данных
- Создает слои данных, оценивает качество данных, работает с проектами
- Умеет использовать информационные каскады как модель сетевого маркетинга и оценивать успешность сетевого маркетинга
- Умеет моделировать распространение информации. Понимает сущность понятия эпидемии в информационном поле
- Умеет строить модель классификации элементов сети, выявлять агентов влияния, осуществлять количественные предсказания на основе временных динамических графов
- Умеет строить рекомендации связей между элементами сети, владеет методами детектирования фрода в сетях
- знать основы картографии и геоинформатики
- применять инструменты визуализации пространственных данных
- производить сбор и обработку пространственных данных и интегрировать собранную информацию в единую карту
- получить навыки оформления и дизайна графического материала
Содержание учебной дисциплины
- Начало работы с общедоступными платформами ГИС. Ресурсы
- Математические основы картографии
- Виды пространственных данных
- Работа с данными в ГИС, создание слоев и проектов
- Аналитические инструменты работы с данными
- Визуализация данных, дизайн карт
- Практическая работа: ГИС проект
- Введение в сетевой анализ
- Описательные статистики реальных сетей
- Модели формирования сети
- Меры влияния агентов в неориентированных сетях
- Меры влияния агентов в ориентированных сетях
- Структурная эквивалентность
- Сообщества в социальных сетях
- Распространение и эпидемии в сетях
- Распространение инноваций и информационные каскады
- Распространение влияния и консенсус в социальных сетях
- Векторные модели сетей без атрибутов
- Векторные модели сетей с текстовыми атрибутами
- Предсказание связей и рекомендации в сетях
- Классификация сетевых данных и графовые нейронные сети
- Знакомство с компьютерной линвгистикой
- Регулярные выражения, tokenization etc.
- Частотные списки, мера TF-IDF. Извлечение ключевых слов, алгоритм RAKE
- Векторизация текстов, векторная семантика. Bag of Words, word2vec, ресурс RusVectores.
- Автоматическая классификация документов
- Text Mining
- Сетевой анализ
Элементы контроля
- Посещаемость 1 модуля
- Выполнение заданий на семинарах 1 модуля
- Финальный проект по итогам 1 модуля
- Активность на занятиях и выполнение домашних заданий 3 модуля
- Финальный проект 3 модуля
- Посещение занятий и выполнение заданий 2 модуляОсновной формой работы на семинарах является программирование в IPython Notebook. Формы работы и критерии оценивания на каждом конкретном семинаре преподаватель озвучивает студентам.
- Проект 1
- Проект 2
Промежуточная аттестация
- 2021/2022 учебный год 2 модуль0.1 * Активность на занятиях и выполнение домашних заданий 3 модуля + 0.2 * Выполнение заданий на семинарах 1 модуля + 0.05 * Посещаемость 1 модуля + 0.25 * Финальный проект по итогам 1 модуля + 0.25 * Посещение занятий и выполнение заданий 2 модуля + 0.15 * Финальный проект 3 модуля
- 2021/2022 учебный год 3 модуль0.7 * 2021/2022 учебный год 2 модуль + 0.21 * Посещаемость 1 модуля + 0.09 * Выполнение заданий на семинарах 1 модуля
Список литературы
Рекомендуемая основная литература
- Easley, D., & Kleinberg, J. (2010). Networks, Crowds, and Markets : Reasoning About a Highly Connected World. New York: Cambridge eText. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=324125
- Витковский, В. В. Картография (теория картографических проекций) / В. В. Витковский. — Санкт-Петербург : Издательство "Лань", 2013. — 473 с. — ISBN 978-5-507-31477-5. — Текст : электронный // Лань : электронно-библиотечная система. — URL: https://e.lanbook.com/book/32797 (дата обращения: 00.00.0000). — Режим доступа: для авториз. пользователей.
- Инновационное развитие: экономика, интеллектуальные ресурсы, управление знаниями : монография / под ред. Б.З. Мильнера. — М. : ИНФРАМ, 2018. — 624 с. — (Научная мысль). - Режим доступа: http://znanium.com/catalog/product/975926
- Картография и ГИС : учеб. пособие / В.П. Раклов. — 3-е изд., стереотип. — М. : ИНФРА-М, 2019. — 215 с. — (Высшее образование: Бакалавриат). - Режим доступа: http://znanium.com/catalog/product/1022695
- Основы алгоритмизации и программирования на Python : учеб. пособие / С.Р. Гуриков. — М. : ФОРУМ : ИНФРА-М, 2019. — 343 с. — (Среднее профессиональное образование). - Режим доступа: http://znanium.com/catalog/product/970143
Рекомендуемая дополнительная литература
- Anthony G. Cohn, & David M. Mark. (2005). Spatial Information Theory : International Conference, COSIT 2005, Elliottville, NY, USA, September 14-18, 2005: Proceedings. Springer.
- Newman, M. E. J. (2010). Networks : An Introduction. Oxford: OUP Oxford. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=nlebk&AN=458550
- Understanding Geo-spatial Information on Social Media. (2016). https://doi.org/10.4233/uuid:06c072ad-4db6-4d3b-b747-784e30d862a4
- Yanqing Xu, & Eugene Kennedy. (2015). An Introduction to Spatial Analysis in Social Science Research. Tutorials in Quantitative Methods for Psychology, (1), 22. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsdoj&AN=edsdoj.571b8abf375d4e059682324f8fae0c6d
- Информатика и лингвистика : учеб. пособие / Т.М. Волосатова, Н.В. Чичварин. — Москва : ИНФРА-М, 2018. — 196 с. + Доп. материалы [Электронный ресурс; Режим доступа: https://new.znanium.com]. — (Высшее образование: Бакалавриат). — www.dx.doi.org/10.12737/16175. - Текст : электронный. - URL: http://znanium.com/catalog/product/938009
- Языкознание: От Аристотеля до компьютерной лингвистики: Научно-популярное / Алпатов В. - М.:Альпина нон-фикшн, 2018. - 253 с.: 60x90 1/16. - (Научно-популярная литература) (Переплёт) ISBN 978-5-91671-804-1 - Режим доступа: http://znanium.com/catalog/product/1003471