We use cookies in order to improve the quality and usability of the HSE website. More information about the use of cookies is available here, and the regulations on processing personal data can be found here. By continuing to use the site, you hereby confirm that you have been informed of the use of cookies by the HSE website and agree with our rules for processing personal data. You may disable cookies in your browser settings.

  • A
  • A
  • A
  • ABC
  • ABC
  • ABC
  • А
  • А
  • А
  • А
  • А
Regular version of the site

Introduction to the Spatial Data Analysis

2024/2025
Academic Year
RUS
Instruction in Russian
6
ECTS credits
Course type:
Compulsory course
When:
1 year, 1, 2 module

Instructors


Batov, Alexey

Программа дисциплины

Аннотация

Курс «Основы анализа пространственных данных» входит в группу обязательных предметов специализации «Пространственные данные и прикладная геоаналитика». Курс направлен на то, чтобы научить студентов выбирать и технически применять (на Python) базовые методы работы с данными (визуализации, разведочного анализа, очистки и подготовки, базовой статистики) с учетом ряда специфических эффектов, характерных для пространственно-временных геоданных. Также уделяется внимание специфике работы с различными способами хранения геоданных. Успешное освоение дисциплины позволит грамотно встраивать этап подготовки и первичного анализа данных в решение исследовательских или прикладных задач в области природных и социально-экономических систем. Курс закладывает базовые знания для курсов «Машинное обучение в пространственных задачах» и «Математическое моделирование в пространственных задачах», являющихся обязательными в специализации «Пространственные данные и прикладная геоаналитика».
Цель освоения дисциплины

Цель освоения дисциплины

  • Получить теоретические знания и практические навыки их реализации в Python в области ряда базовых этапов подготовки данных, их визуализации и разведочного анализа с учетом специфики пространственных данных.
Планируемые результаты обучения

Планируемые результаты обучения

  • Умеет автоматизировать однотипные операции над большими объемами данных, включая их получение из внешних источников или их создание.
  • Владеет на базовом уровне навыками программирования на Python для работы с табличными данными, для работы с векторными и растровыми геоданными, для визуализации данных и результатов анализа.
  • Знает типы хранения данных, правильно выбирает для заданной ситуации, реализует конвертацию в нужный тип; учитывает в своей работе вопросы затрат вычислительных ресурсов и памяти
  • Умеет выстроить дизайн исследования, знает и правильно выбирает методы подготовки, анализа и визуализации результатов согласно имеющимся данным и задаче: - Знает способы проверки качества данных, методы исправления проблем - Знает различные виды графиков, правильно выбирает для каждого этапа исследования (контроль качества / анализ / визуализация результатов), компанует сложные графики
  • Знает базовые методы анализа из групп: (i) классических статистики, дисперсионного и регрессионного анализа, (ii) специфических методов для пространственных данных, (iii) специфических методов для временных рядов.
Содержание учебной дисциплины

Содержание учебной дисциплины

  • Введение в анализ данных.
  • Манипуляции и визуализация.
  • Статистические методы.
  • Специфические методы работы с пространственными данными.
Элементы контроля

Элементы контроля

  • неблокирующий Практическая работа “Подготовка данных и графики”
    Практическая работа проводится в конце Темы “Манипуляции и визуализация” и проверяет умение проводить предобработку данных (табличных, векторных, растровых) и строить графики. Задание выполняется в течении семинара оффлайн и сдается в виде Jupyter-блокнота, содержащего код, результаты его работы и краткую текстовую аналитическую записку согласно сформулированному заданию. Работа выполняется на основе данных, предоставленных преподавателем. Разрешено пользоваться литературой, включая собственные записи и интернет-источники; запрещено пользоваться генеративными нейронными сетями.
  • неблокирующий Проектная работа “Исследование полного цикла”
    Работа представляет собой выполнение и презентацию творческого проекта, в котором должно быть продемонстрировано умение проводить полный цикл использования данных в исследовании (прикладном или научном) от постановки задачи и выбора методов до оформления и представления результатов. Проект выполняется в течении модуля, индивидуально, в часы самостоятельной работы; для получения оценки результаты презентуются на очной защите (публичное выступление перед учебной группой с ответами на вопросы) и передаются преподавателю в виде Jupyter-блокнота, содержащего код, результаты его работы и краткие текстовые пояснения о выполненных этапах работы с обоснованием выборов. Для выполнения проекта могут использоваться любые данные, включая материалы семинарских занятий или собственные данные студента; в случае переиспользования данных из ранее выполненных проектов (курсовых, рабочих и др.), должна быть продемонстрирована новизна результатов, полученная с помощью рассмотренных в дисциплине теоретических и практических тем. Обязательными разделами работы являются: подготовка и/или преобразование данных, визуализация (не менее 2 графиков различного вида), применение методов статистического анализа (не менее одного), техническая интерпретация данных (в виде краткого пояснения), тематическая интерпретация графиков (в виде краткого пояснения). Разрешено пользоваться литературой, включая собственные записи и интернет-источники; запрещено пользоваться генеративными нейронными сетями.
  • неблокирующий Работа на семинарах
    По решению преподавателя могут быть поощрены регулярная работа на семинарских занятиях и/или нахождение нестандартных, творческих решений заданий и/или выдающийся личный прогресс в рамках семинарских занятий.
Промежуточная аттестация

Промежуточная аттестация

  • 2024/2025 2nd module
    0.3 * Практическая работа “Подготовка данных и графики” + 0.6 * Проектная работа “Исследование полного цикла” + 0.1 * Работа на семинарах
Список литературы

Список литературы

Рекомендуемая основная литература

  • Lansley, G., de Smith, M., Goodchild, M., & Longley, P. (2019). Big Data and Geospatial Analysis.
  • Маккинни, У. Python и анализ данных / У. Маккинни , перевод с английского А. А. Слинкина. — 2-ое изд., испр. и доп. — Москва : ДМК Пресс, 2020. — 540 с. — ISBN 978-5-97060-590-5. — Текст : электронный // Лань : электронно-библиотечная система. — URL: https://e.lanbook.com/book/131721 (дата обращения: 00.00.0000). — Режим доступа: для авториз. пользователей.
  • Миркин, Б. Г.  Введение в анализ данных : учебник и практикум / Б. Г. Миркин. — Москва : Издательство Юрайт, 2020. — 174 с. — (Высшее образование). — ISBN 978-5-9916-5009-0. — Текст : электронный // Образовательная платформа Юрайт [сайт]. — URL: https://urait.ru/bcode/450262 (дата обращения: 27.08.2024).

Рекомендуемая дополнительная литература

  • Wilke, C. V. (DE-588)121247104, (DE-627)081180608, (DE-576)292607067, aut. (2019). Fundamentals of data visualization a primer on making informative and compelling figures Claus O. Wilke. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edswao&AN=edswao.103046006X

Авторы

  • Деркачева Анна Андреевна