Магистратура
2024/2025
SQL для работы с рыночными данными
Статус:
Курс по выбору (Социальный анализ рынков на цифровых и опросных данных)
Направление:
39.04.01. Социология
Кто читает:
Департамент социологии
Где читается:
Факультет социальных наук
Когда читается:
2-й курс, 1 модуль
Формат изучения:
без онлайн-курса
Охват аудитории:
для всех кампусов НИУ ВШЭ
Преподаватели:
Пашков Станислав Георгиевич
Прогр. обучения:
Прикладные методы социального анализа рынков
Язык:
русский
Кредиты:
3
Программа дисциплины
Аннотация
Аннотация: Курс посвящен рассмотрению принципов проектирования и управления базами данных в реляционной парадигме. Актуальность курса обусловлена необходимостью работы с социологическими данными большого объема и связной структуры (панельные базы данных, лонгитюдные базы данных). В рамках курса слушатели познакомятся с базовой архитектурой реляционных баз данных, приобретут теоретические и практические навыки конструирования таблиц данных, формирования запросов различной сложности на языке SQL, а также использование полученных запросов на дальнейших этапах обработки данных. Рассмотрен пример установки программного комплекса СУБД PostgreSQL и SQLite в виртуальную машину, клиентов для доступа к структуре БД (Dbeaver + RStudio). В качестве инструмента для аналитики используется статистическая среда R. В результате освоения курса слушатели приобретают навыки самостоятельного создания и управления СУБД, подключения систем аналитики и выборки данных в социологических исследованиях.
Цель освоения дисциплины
- Получение системных представлений об архитекстуре реляционных баз данных и СУБД.
- Приобретение навыков установки, настройки сервера и клиента СУБД для проектирования баз данных и выполнения запросов на языке SQL.
- Выработка навыков построения эффективных запросов на языке SQL.
- Приобретение навыков манипуляции с базами данных с помощью DBeaver и статистической среды R.
Планируемые результаты обучения
- знание синтаксиса SQL, агрегационных функций, журналирование;
- Умеет разарабатывать запросы с использованием языка SQL, реализующие алгоритмы, разработанные на основе операторов реляционной алгебны, включающие возможности связывания таблиц, отбора данных в соответствии с заданными критериями, использования для вычислений агрегатных функций и возможностей группировки данных, возможностей сортировки данных и использования вложенных запросов
- Владение навыками формирования SQL-запросов к БД
- Знать технологию проектирования сверху-вниз ER-диаграмм.
- Студенты познакомятся и сформируют первичный опыт работы в среде R
- Двоичная булева алгебра: множество элементов, множество операций. Определение и доказательство постулатов булевой алгебры. Применение булевой алгебры.
- Знание основных возможностей системы PostgreSQL и расширений моделей данных и языков запросов, предоставляемые в этой системе.
- Рассчитывать статистические критерии в среде R
- Проводить регрессионный, факторный и кластерный анализы в среде R
- выполняет анализ данных, используя окна и оконные функции в запросах на выборку
- Умеет выполнять инфологическое проектирование баз данных методом «сущность-связь»
- Получение системного представления об истории и классификации технологий проектирования баз данных.
- Знание основных возможностей системы SQLite и расширений моделей данных и языков запросов, предоставляемые в этой системе.
- Знание основных концепций и принципов реляционной теории.
- Приобретение практических навыков записи, построения и анализа регрессионных моделей, выполненных в статистической среде R.
- Приобретение практических навыков организации процедуры анализа статистических (социологических) данных на языке R.
- Получение представления о формах и паттернах взаимодействия статистической среды R и СУБД с применением языка SQL.
Содержание учебной дисциплины
- Тема №1: История развития баз данных и СУБД. Концептуальная архитектура и операционализация основных понятий. СУБД PostgreSQL и SQLite.
- Тема №2: Введение в реляционную теорию и проектирование баз данных
- Тема №3: Язык SQL (Часть 1): фундаментальные подходы и устройство синтаксиса
- Тема №4: Язык SQL (Часть 2): Расширенные манипуляции, оконные функции, индексирование, процедурный SQL
- Тема №5: Построение аналитических пайплайнов на языке R
Элементы контроля
- Лабораторная работа №1: настройка СУБД, проектирование базы данных и ER-структурыЛабораторная работа представляет собой набор практических упражнений, охватывающих Тему №1 и Тему №2 учебного курса. Студенты должны на своих компьютерах создать и настроить тестовую базу данных, внести необходимые данные, проверить целостнтсть базы данных, описать её структуру с помощью ER-диаграмм.
- Лабораторная работа №2: Построение запросов и манипуляция с данными на языке SQLЛабораторная работа представляет собой набор практических упражнений, охватывающих Тему №3 и Тему №4 учебного курса. Студенты должны на своих компьютерах продемонстрировать навыки построения простых и сложных запросов на языке SQL, одновременно с этим не допуская риски потери структуры и целостности данных внутри СУБД.
- Финальный проект: Обработка базы данных с использованием языков R и SQLДанная форма контроля предполагает под собой реализацию Темы №5 и Темы №6 учебного курса. Основное внимание уделено языку R и взаимодействию с СУБД и языком SQL. Предполагается, что студент получил комплексное представление об устройстве СУБД и навыках взаимодействия с базами данных при помощи SQL. В рамках финального проекта необходимо представить концепцию банка данных социологических исследований, которые затем трансформируются в формат таблиц данных в СУБД PostgreSQL. Дополнительно студентом выполняется процесс организации структуры данных, таблиц и дальнейшей обработки данных при помощи статистической среды R. Студенту необходимо подговить небольшую презентацию с описанием структуры данных, а также набор скриптов, дамп базы данных для последующей оценки.
Промежуточная аттестация
- 2024/2025 1st module0.25 * Лабораторная работа №1: настройка СУБД, проектирование базы данных и ER-структуры + 0.35 * Лабораторная работа №2: Построение запросов и манипуляция с данными на языке SQL + 0.4 * Финальный проект: Обработка базы данных с использованием языков R и SQL
Список литературы
Рекомендуемая основная литература
- , А. Н. Основы технологий баз данных : руководство / А. Н. , Е. А. Горшкова, Н. Г. Графеева , под редакцией Е. В. Рогова. — 2-е изд. — Москва : ДМК Пресс, 2020. — 582 с. — ISBN 978-5-97060-841-8. — Текст : электронный // Лань : электронно-библиотечная система. — URL: https://e.lanbook.com/book/179477 (дата обращения: 00.00.0000). — Режим доступа: для авториз. пользователей.
- PostgreSQL. Разработка баз данных : учебник / М. Ф. Ванина, А. Г. Ерохин, Н. В. Тутова [и др.]. — Москва : Русайнс, 2023. — 227 с. — ISBN 978-5-466-03410-3. — URL: https://book.ru/book/950185 (дата обращения: 27.08.2024). — Текст : электронный.
- Robert I. Kabacoff. (2015). R in Action : Data Analysis and Graphics with R: Vol. Second edition. Manning.
- SQL. Полное руководство, Грофф, Дж., 2018
- Введение в системы баз данных, Дейт, К. Дж., 2005
- Сидорова, Н. П. Базы данных: практикум по проектированию реляционных баз данных : учебное пособие / Н. П. Сидорова. — Королёв : МГОТУ, 2020. — 92 с. — ISBN 978-5-4499-0799-8. — Текст : электронный // Лань : электронно-библиотечная система. — URL: https://e.lanbook.com/book/149436 (дата обращения: 00.00.0000). — Режим доступа: для авториз. пользователей.
- Токмаков, Г. П. Базы данных: Модели и структуры данных, язык SQL, программирование баз данных : учебное пособие / Г. П. Токмаков. — Ульяновск : УлГТУ, 2021. — 362 с. — ISBN 978-5-9795-2184-8. — Текст : электронный // Лань : электронно-библиотечная система. — URL: https://e.lanbook.com/book/259706 (дата обращения: 00.00.0000). — Режим доступа: для авториз. пользователей.
Рекомендуемая дополнительная литература
- Beaulieu, A. (2009). Learning SQL : Master SQL Fundamentals: Vol. 2nd ed. O’Reilly Media.
- SQL: быстрое погружение. - 978-5-4461-1835-9 - Шилдс Уолтер - 2022 - Санкт-Петербург: Питер - https://ibooks.ru/bookshelf/389413 - 389413 - iBOOKS
- SQL. Сборник рецептов. — 2-е изд.: Пер. с англ. - 978-5-9775-6759-6 - Молинаро Э., Грааф Р. - 2022 - Санкт-Петербург: БХВ-Петербург - https://ibooks.ru/bookshelf/380028 - 380028 - iBOOKS
- Лысенкова, С. Н. «Распределенные базы данных». Основы языка SQL : учебное пособие / С. Н. Лысенкова. — Брянск : Брянский ГАУ, 2022. — 36 с. — Текст : электронный // Лань : электронно-библиотечная система. — URL: https://e.lanbook.com/book/305006 (дата обращения: 00.00.0000). — Режим доступа: для авториз. пользователей.
- Маркин, А. В. Программирование на SQL : учебное пособие для среднего профессионального образования / А. В. Маркин. — Москва : Издательство Юрайт, 2023. — 435 с. — (Профессиональное образование). — ISBN 978-5-534-11093-7. — Текст : электронный // Образовательная платформа Юрайт [сайт]. — URL: https://urait.ru/bcode/518166 (дата обращения: 27.08.2024).
- Маркин, А. В. Построение запросов и программирование на SQL : учебное пособие / А. В. Маркин. — Рязань : РГРТУ, 2008. — 312 с. — Текст : электронный // Лань : электронно-библиотечная система. — URL: https://e.lanbook.com/book/168022 (дата обращения: 00.00.0000). — Режим доступа: для авториз. пользователей.
- Рогов, Е. В. PostgreSQL 15 изнутри : руководство / Е. В. Рогов. — Москва : ДМК Пресс, 2023. — 662 с. — ISBN 978-5-93700-178-8. — Текст : электронный // Лань : электронно-библиотечная система. — URL: https://e.lanbook.com/book/348089 (дата обращения: 00.00.0000). — Режим доступа: для авториз. пользователей.