• A
  • A
  • A
  • ABC
  • ABC
  • ABC
  • А
  • А
  • А
  • А
  • А
Regular version of the site

Introduction to the Spatial Data Analysis

2024/2025
Academic Year
RUS
Instruction in Russian
6
ECTS credits
Course type:
Compulsory course
When:
1 year, 1, 2 module

Instructors


Batov, Alexey

Программа дисциплины

Аннотация

Курс «Основы анализа пространственных данных» входит в группу обязательных предметов специализации «Пространственные данные и прикладная геоаналитика». Курс направлен на то, чтобы научить студентов выбирать и технически применять (на Python) базовые методы работы с данными (визуализации, разведочного анализа, очистки и подготовки, базовой статистики) с учетом ряда специфических эффектов, характерных для пространственно-временных геоданных. Также уделяется внимание специфике работы с различными способами хранения геоданных. Успешное освоение дисциплины позволит грамотно встраивать этап подготовки и первичного анализа данных в решение исследовательских или прикладных задач в области природных и социально-экономических систем. Курс закладывает базовые знания для курсов «Машинное обучение в пространственных задачах» и «Математическое моделирование в пространственных задачах», являющихся обязательными в специализации «Пространственные данные и прикладная геоаналитика».
Цель освоения дисциплины

Цель освоения дисциплины

  • Получить теоретические знания и практические навыки их реализации в Python в области ряда базовых этапов подготовки данных, их визуализации и разведочного анализа с учетом специфики пространственных данных.
Планируемые результаты обучения

Планируемые результаты обучения

  • Умеет автоматизировать однотипные операции над большими объемами данных, включая их получение из внешних источников или их создание.
  • Владеет на базовом уровне навыками программирования на Python для работы с табличными данными, для работы с векторными и растровыми геоданными, для визуализации данных и результатов анализа.
  • Знает типы хранения данных, правильно выбирает для заданной ситуации, реализует конвертацию в нужный тип; учитывает в своей работе вопросы затрат вычислительных ресурсов и памяти
  • Умеет выстроить дизайн исследования, знает и правильно выбирает методы подготовки, анализа и визуализации результатов согласно имеющимся данным и задаче: - Знает способы проверки качества данных, методы исправления проблем - Знает различные виды графиков, правильно выбирает для каждого этапа исследования (контроль качества / анализ / визуализация результатов), компанует сложные графики
  • Знает базовые методы анализа из групп: (i) классических статистики, дисперсионного и регрессионного анализа, (ii) специфических методов для пространственных данных, (iii) специфических методов для временных рядов.
Содержание учебной дисциплины

Содержание учебной дисциплины

  • Введение в анализ данных.
  • Манипуляции и визуализация.
  • Статистические методы.
  • Специфические методы работы с пространственными данными.
Элементы контроля

Элементы контроля

  • неблокирующий Практическая работа “Подготовка данных и графики”
    Практическая работа проводится в конце Темы “Манипуляции и визуализация” и проверяет умение проводить предобработку данных (табличных, векторных, растровых) и строить графики. Задание выполняется в течении семинара оффлайн и сдается в виде Jupyter-блокнота, содержащего код, результаты его работы и краткую текстовую аналитическую записку согласно сформулированному заданию. Работа выполняется на основе данных, предоставленных преподавателем. Разрешено пользоваться литературой, включая собственные записи и интернет-источники; запрещено пользоваться генеративными нейронными сетями.
  • неблокирующий Проектная работа “Исследование полного цикла”
    Работа представляет собой выполнение и презентацию творческого проекта, в котором должно быть продемонстрировано умение проводить полный цикл использования данных в исследовании (прикладном или научном) от постановки задачи и выбора методов до оформления и представления результатов. Проект выполняется в течении модуля, индивидуально, в часы самостоятельной работы; для получения оценки результаты презентуются на очной защите (публичное выступление перед учебной группой с ответами на вопросы) и передаются преподавателю в виде Jupyter-блокнота, содержащего код, результаты его работы и краткие текстовые пояснения о выполненных этапах работы с обоснованием выборов. Для выполнения проекта могут использоваться любые данные, включая материалы семинарских занятий или собственные данные студента; в случае переиспользования данных из ранее выполненных проектов (курсовых, рабочих и др.), должна быть продемонстрирована новизна результатов, полученная с помощью рассмотренных в дисциплине теоретических и практических тем. Обязательными разделами работы являются: подготовка и/или преобразование данных, визуализация (не менее 2 графиков различного вида), применение методов статистического анализа (не менее одного), техническая интерпретация данных (в виде краткого пояснения), тематическая интерпретация графиков (в виде краткого пояснения). Разрешено пользоваться литературой, включая собственные записи и интернет-источники; запрещено пользоваться генеративными нейронными сетями.
  • неблокирующий Работа на семинарах
    По решению преподавателя могут быть поощрены регулярная работа на семинарских занятиях и/или нахождение нестандартных, творческих решений заданий и/или выдающийся личный прогресс в рамках семинарских занятий.
Промежуточная аттестация

Промежуточная аттестация

  • 2024/2025 2nd module
    0.3 * Практическая работа “Подготовка данных и графики” + 0.6 * Проектная работа “Исследование полного цикла” + 0.1 * Работа на семинарах
Список литературы

Список литературы

Рекомендуемая основная литература

  • Lansley, G., de Smith, M., Goodchild, M., & Longley, P. (2019). Big Data and Geospatial Analysis.
  • Маккинни, У. Python и анализ данных / У. Маккинни , перевод с английского А. А. Слинкина. — 2-ое изд., испр. и доп. — Москва : ДМК Пресс, 2020. — 540 с. — ISBN 978-5-97060-590-5. — Текст : электронный // Лань : электронно-библиотечная система. — URL: https://e.lanbook.com/book/131721 (дата обращения: 00.00.0000). — Режим доступа: для авториз. пользователей.
  • Миркин, Б. Г.  Введение в анализ данных : учебник и практикум / Б. Г. Миркин. — Москва : Издательство Юрайт, 2020. — 174 с. — (Высшее образование). — ISBN 978-5-9916-5009-0. — Текст : электронный // Образовательная платформа Юрайт [сайт]. — URL: https://urait.ru/bcode/450262 (дата обращения: 27.08.2024).

Рекомендуемая дополнительная литература

  • Wilke, C. V. (DE-588)121247104, (DE-627)081180608, (DE-576)292607067, aut. (2019). Fundamentals of data visualization a primer on making informative and compelling figures Claus O. Wilke. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edswao&AN=edswao.103046006X

Авторы

  • Деркачева Анна Андреевна