• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта
2023/2024

Программирование для анализа городских данных

Лучший по критерию «Полезность курса для расширения кругозора и разностороннего развития»
Лучший по критерию «Новизна полученных знаний»
Статус: Маго-лего
Когда читается: 2 семестр
Охват аудитории: для своего кампуса
Язык: русский
Кредиты: 6
Контактные часы: 28

Программа дисциплины

Аннотация

Современный городской планировщик и исследователь должен быть в курсе процессов, которые можно изучать с помощью новых источников данных и инструментов анализа. В современном урбанизированном мире ежедневно генерируются огромные объемы данных: от жалоб и отчетов граждан до их поисковых запросов, ежедневные перемещения, показания счетчиков электроэнергии и т.д. Анализ этих данных создает новые возможности для изучения городских явлений и позволяет использовать новые научные подходы в городском планировании и управлении. Необычайный объем и многомерность городских данных требуют изучения новых инструментов и методов сбора и получения таких данных, придания им определенной формы, подходящей для анализа, и проведения самого анализа. Курс знакомит студентов с типами данных (особенно пространственными данными), имеющими отношение к городским исследованиям, передовыми инструментами работы с такими данными, полным процессом анализа данных: от сбора данных и их визуализации до трактовки, выводов и представления результатов. Конкретные темы включают сбор данных, обработку и подготовку данных, исследовательский анализ, статистический анализ (базовая регрессия и введение в пространственную автокорреляцию и регрессию), визуализацию данных и воспроизводимую отчетность. В ходе курса студенты будут использовать язык статистического программирования R и RStudio IDE (интегрированную среду разработки), но концепции, используемые в курсе, и приобретенные навыки могут быть применены в Python, Julia или любом другом языке программирования с библиотеками анализа данных.
Цель освоения дисциплины

Цель освоения дисциплины

  • Познакомить учащихся с различными типами источников городских данных, типами файлов и баз данных, используемыми для хранения таких данных.
  • Понимать происхождение и связанные с ним ограничения различных источников городских данных.
  • Освоить и демонстрировать методы визуализации и EDA в городском планировании и исследованиях.
  • Понимать и объяснять значимость временного и пространственного измерения городских данных.
  • Понимать и объяснять, как городские данные структурируются и хранятся.
  • Выработать аналитические навыки применения статистических методов анализа к большим и компактным наборам городских данных.
  • Понимать и уметь объяснить базовые принципы EDA (эксплораторного анализа данных)
  • Освоить методы донесения результатов исследования с помощью визуализаций и таблиц.
Планируемые результаты обучения

Планируемые результаты обучения

  • Иллюстрировать особенности реализации платформенного и экосистемного подходов в построении взаимодействия между городами и Smart City-проектами
  • Получать городские пространственные данные из различных источников.
  • Студент может создавать скрипты для анализа данных
  • Уметь писать скрипты на языке R
Содержание учебной дисциплины

Содержание учебной дисциплины

  • 01. Введение в городские данные и smart cities
  • 02. Введение в скриптовые инструменты анализа данных и проведение воспроизводимых исследований
  • 03. Предварительные исследования данных (EDA) и базовые техники визуализации
  • 04. Виды и источники городских данных. Ключевые наборы открытых городских данных и базовые техники работы с ними
  • 06. Элементы математической статистики, базовые процедуры исследования наборов данных перед оценкой регрессионных и иных моделей. Методы оценки эффективности предсказательных моделей
Элементы контроля

Элементы контроля

  • неблокирующий Лабораторная 01 - вводная
  • неблокирующий Лабораторная 02. Таблицы, базовый ГИС
  • неблокирующий Лабораторная 03. Научные графики, ggplot2
  • неблокирующий Лабораторная 04. Регрессионные модели
  • неблокирующий Обязательные курсы DataCamp
  • неблокирующий Курсы по выбору в системе DataCamp
  • неблокирующий Экзамен
Промежуточная аттестация

Промежуточная аттестация

  • 2023/2024 учебный год II семестр
    0.15 * Курсы по выбору в системе DataCamp + 0.1 * Лабораторная 01 - вводная + 0.1 * Лабораторная 02. Таблицы, базовый ГИС + 0.15 * Лабораторная 03. Научные графики, ggplot2 + 0.15 * Лабораторная 04. Регрессионные модели + 0.05 * Обязательные курсы DataCamp + 0.3 * Экзамен
Список литературы

Список литературы

Рекомендуемая основная литература

  • R for data science : import, tidy, transform, visualize, and model data, Wickham, H., 2017

Рекомендуемая дополнительная литература

  • Hierarchical modeling and analysis for spatial data, Banerjee, S., 2015