Бакалавриат
2024/2025
Программирование в целях анализа городских данных. Продвинутый уровень.
Статус:
Курс по выбору (Городское планирование)
Направление:
07.03.04. Градостроительство
Кто читает:
Высшая школа урбанистики имени А.А. Высоковского
Где читается:
Факультет городского и регионального развития
Когда читается:
5-й курс, 1, 2 модуль
Формат изучения:
без онлайн-курса
Охват аудитории:
для своего кампуса
Преподаватели:
Кульчицкий Юрий Викторович
Язык:
русский
Кредиты:
5
Программа дисциплины
Аннотация
Сегодня городской планировщик сталкивается с необходимостью оперировать большими массивами пространственных данных, уметь ставить исследовательские вопросы при работе с такими данными. Дополнительное измерение таких данных – время, усложняет анализ и требует особых навыков при анализе. Использование языка программирования R позволяет легко управлять большими массивами пространственно-временных данных, строить модели пространственной регрессии, применять различные алгоритмы машинного обучения.
Цель освоения дисциплины
- Цель данной дисциплины по выбору – научить студента эффективно решать различные задачи обработки городских данных при помощи языка программирования R и сопутствующих инструментов.
Планируемые результаты обучения
- Получать городские пространственные данные из различных источников.
- Уметь писать скрипты на языке R
Содержание учебной дисциплины
- 01. Введение в городские данные и smart cities
- 02. Введение в скриптовые инструменты анализа данных и проведение воспроизводимых исследований
- 03. Предварительные исследования данных (EDA) и базовые техники визуализации
- 04. Виды и источники городских данных. Ключевые наборы открытых городских данных и базовые техники работы с ними
- 05. Понятие tidy data. Очистка, и трансформация наборов данных, конвертация их типов. Алгоритмы эффективной обработки наборов данных
- 06. Элементы математической статистики, базовые процедуры исследования наборов данных перед оценкой регрессионных и иных моделей. Методы оценки эффективности предсказательных моделей
- 07. Продвинутые методы обработки пространственных данных. Пространственная статистика и пространственные модели
- 08. Элементы протоколов коммуникации и релевантных форматов хранения и передачи данных. Работа с API, методы веб-скрейпинга, специфика собранных автоматическим образом данных. Продвинутые методы создания отчетов
Элементы контроля
- Лабораторная 00 - тестовая
- Лабораторная 03. Tidy Data
- Лабораторная 01. Таблицы, базовый ГИС
- Лабораторная 04. Регрессионные модели
- Лабораторная 02. Научные графики, ggplot2
- Обязательные курсы DataCamp
- Курсы по выбору в системе DataCamp
- Экзамен
- Лабораторная 07. Парсинг данных из открытых источников
- Лабораторная 05. Пространственные модели - 01
- Лабораторная 06. Пространственные модели - 02
Промежуточная аттестация
- 2024/2025 учебный год 2 модуль0.1 * Курсы по выбору в системе DataCamp + 0.001 * Лабораторная 00 - тестовая + 0.05 * Лабораторная 01. Таблицы, базовый ГИС + 0.05 * Лабораторная 02. Научные графики, ggplot2 + 0.1 * Лабораторная 03. Tidy Data + 0.08 * Лабораторная 04. Регрессионные модели + 0.05 * Лабораторная 05. Пространственные модели - 01 + 0.05 * Лабораторная 06. Пространственные модели - 02 + 0.08 * Лабораторная 07. Парсинг данных из открытых источников + 0.039 * Обязательные курсы DataCamp + 0.4 * Экзамен
Список литературы
Рекомендуемая основная литература
- R for data science : import, tidy, transform, visualize, and model data, Wickham, H., 2017
- Wickham, H., & Grolemund, G. (2016). R for Data Science : Import, Tidy, Transform, Visualize, and Model Data (Vol. First edition). Sebastopol, CA: Reilly - O’Reilly Media. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=1440131
Рекомендуемая дополнительная литература
- Hierarchical modeling and analysis for spatial data, Banerjee, S., 2015