2024/2025
Основы анализа пространственных данных
Статус:
Маго-лего
Когда читается:
1, 2 модуль
Охват аудитории:
для своего кампуса
Язык:
русский
Кредиты:
6
Программа дисциплины
Аннотация
Курс «Основы анализа пространственных данных» входит в группу обязательных предметов специализации «Пространственные данные и прикладная геоаналитика». Курс направлен на то, чтобы научить студентов выбирать и технически применять (на Python) базовые методы работы с данными (визуализации, разведочного анализа, очистки и подготовки, базовой статистики) с учетом ряда специфических эффектов, характерных для пространственно-временных геоданных. Также уделяется внимание специфике работы с различными способами хранения геоданных. Успешное освоение дисциплины позволит грамотно встраивать этап подготовки и первичного анализа данных в решение исследовательских или прикладных задач в области природных и социально-экономических систем. Курс закладывает базовые знания для курсов «Машинное обучение в пространственных задачах» и «Математическое моделирование в пространственных задачах», являющихся обязательными в специализации «Пространственные данные и прикладная геоаналитика».
Цель освоения дисциплины
- Получить теоретические знания и практические навыки их реализации в Python в области ряда базовых этапов подготовки данных, их визуализации и разведочного анализа с учетом специфики пространственных данных.
Планируемые результаты обучения
- Умеет автоматизировать однотипные операции над большими объемами данных, включая их получение из внешних источников или их создание.
- Владеет на базовом уровне навыками программирования на Python для работы с табличными данными, для работы с векторными и растровыми геоданными, для визуализации данных и результатов анализа.
- Знает типы хранения данных, правильно выбирает для заданной ситуации, реализует конвертацию в нужный тип; учитывает в своей работе вопросы затрат вычислительных ресурсов и памяти
- Умеет выстроить дизайн исследования, знает и правильно выбирает методы подготовки, анализа и визуализации результатов согласно имеющимся данным и задаче: - Знает способы проверки качества данных, методы исправления проблем - Знает различные виды графиков, правильно выбирает для каждого этапа исследования (контроль качества / анализ / визуализация результатов), компанует сложные графики
- Знает базовые методы анализа из групп: (i) классических статистики, дисперсионного и регрессионного анализа, (ii) специфических методов для пространственных данных, (iii) специфических методов для временных рядов.
Содержание учебной дисциплины
- Введение в анализ данных.
- Манипуляции и визуализация.
- Статистические методы.
- Специфические методы работы с пространственными данными.
Элементы контроля
- Практическая работа “Подготовка данных и графики”Практическая работа проводится в конце Темы “Манипуляции и визуализация” и проверяет умение проводить предобработку данных (табличных, векторных, растровых) и строить графики. Задание выполняется в течении семинара оффлайн и сдается в виде Jupyter-блокнота, содержащего код, результаты его работы и краткую текстовую аналитическую записку согласно сформулированному заданию. Работа выполняется на основе данных, предоставленных преподавателем. Разрешено пользоваться литературой, включая собственные записи и интернет-источники; запрещено пользоваться генеративными нейронными сетями.
- Проектная работа “Исследование полного цикла”Работа представляет собой выполнение и презентацию творческого проекта, в котором должно быть продемонстрировано умение проводить полный цикл использования данных в исследовании (прикладном или научном) от постановки задачи и выбора методов до оформления и представления результатов. Проект выполняется в течении модуля, индивидуально, в часы самостоятельной работы; для получения оценки результаты презентуются на очной защите (публичное выступление перед учебной группой с ответами на вопросы) и передаются преподавателю в виде Jupyter-блокнота, содержащего код, результаты его работы и краткие текстовые пояснения о выполненных этапах работы с обоснованием выборов. Для выполнения проекта могут использоваться любые данные, включая материалы семинарских занятий или собственные данные студента; в случае переиспользования данных из ранее выполненных проектов (курсовых, рабочих и др.), должна быть продемонстрирована новизна результатов, полученная с помощью рассмотренных в дисциплине теоретических и практических тем. Обязательными разделами работы являются: подготовка и/или преобразование данных, визуализация (не менее 2 графиков различного вида), применение методов статистического анализа (не менее одного), техническая интерпретация данных (в виде краткого пояснения), тематическая интерпретация графиков (в виде краткого пояснения). Разрешено пользоваться литературой, включая собственные записи и интернет-источники; запрещено пользоваться генеративными нейронными сетями.
- Работа на семинарахПо решению преподавателя могут быть поощрены регулярная работа на семинарских занятиях и/или нахождение нестандартных, творческих решений заданий и/или выдающийся личный прогресс в рамках семинарских занятий.
Промежуточная аттестация
- 2024/2025 2nd module0.3 * Практическая работа “Подготовка данных и графики” + 0.6 * Проектная работа “Исследование полного цикла” + 0.1 * Работа на семинарах
Список литературы
Рекомендуемая основная литература
- Lansley, G., de Smith, M., Goodchild, M., & Longley, P. (2019). Big Data and Geospatial Analysis.
- Маккинни, У. Python и анализ данных / У. Маккинни , перевод с английского А. А. Слинкина. — 2-ое изд., испр. и доп. — Москва : ДМК Пресс, 2020. — 540 с. — ISBN 978-5-97060-590-5. — Текст : электронный // Лань : электронно-библиотечная система. — URL: https://e.lanbook.com/book/131721 (дата обращения: 00.00.0000). — Режим доступа: для авториз. пользователей.
- Миркин, Б. Г. Введение в анализ данных : учебник и практикум / Б. Г. Миркин. — Москва : Издательство Юрайт, 2020. — 174 с. — (Высшее образование). — ISBN 978-5-9916-5009-0. — Текст : электронный // Образовательная платформа Юрайт [сайт]. — URL: https://urait.ru/bcode/450262 (дата обращения: 27.08.2024).
Рекомендуемая дополнительная литература
- Wilke, C. V. (DE-588)121247104, (DE-627)081180608, (DE-576)292607067, aut. (2019). Fundamentals of data visualization a primer on making informative and compelling figures Claus O. Wilke. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edswao&AN=edswao.103046006X