Магистратура
2024/2025
Язык программирования Python
Статус:
Курс обязательный (Современный социальный анализ)
Направление:
39.04.01. Социология
Кто читает:
Департамент социологии
Где читается:
Санкт-Петербургская школа социальных наук
Когда читается:
1-й курс, 3 модуль
Формат изучения:
без онлайн-курса
Охват аудитории:
для своего кампуса
Преподаватели:
Ярошенко Евгения Игоревна
Прогр. обучения:
Современный социальный анализ
Язык:
русский
Кредиты:
3
Программа дисциплины
Аннотация
Курс знакомит студентов с языком программирования Python и анализом данных. В рамках курса будут рассмотрены такие важные темы, как основы языка программирования Python, виртуальные среды, предобработка, анализ и визуализация данных (включая различные виды моделирования и алгоритмы машинного обучения), организация аналитического проекта.
Цель освоения дисциплины
- освоить базовые понятия языка программирования Python
- научиться работе с библиотеками Python
Планируемые результаты обучения
- Устанавливает интерпретатор языка Python и пакеты для работы с данными. Устанавливает и настраивает среду разработки Python. Вызывает интерпретатор в командной строке и взаимодействует с ним.
- Организует вычислительный проект. Создает и использует виртуальные среды Python.
- Называет, различает и использует разные типы данных. Различает и использует операторы и ключевые слова. Создает классы и методы. Форматирует и проверяет код, обрабатывает ошибки.
- Реализует загрузку данных, обрабатывает данные, используя пакеты numpy и pandas, и экспортирует данные в различные форматы.
- Реализует сбор данных в сети с помощью парсинга или обращения к API.
- Реализует визуализацию данных с помощью различных пакетов (matplotlib, seaborn и других).
- Выполняет предобработку данных. Строит регрессионные и тематические модели. Объясняет основные понятия машинного обучения.
Содержание учебной дисциплины
- Язык программирования Python: введение
- Основы и синтаксис языка Python
- Обработка данных на языке Python
- Визуализация данных
- Разведочный анализ данных
- Статистические тесты
- Моделирование на языке Python
Элементы контроля
- УпражненияДля закрепления навыков по работе с инструментарием студентам предлагается выполнить упражнения по работе на языке Python.
- Проект по основам машинного обученияПроект по основам машинного обучения. Данные для задания предоставляются преподавателем или обсуждаются в индивидуальном порядке. Работа выполняется индивидуально. Студенты должны применить на конкретных данных методы машинного обучения, такие как регрессионный анализ, классификация и кластеризация, для решения поставленных задач. Проект должен быть написан с ориентацией на “заказчика”, то есть понятен потенциальному клиенту, содержать все необходимые пояснения и интерпретации. Результаты представляются в виде 1) отчета с таблицами / графиками, построением моделей, их выбором и оценкой для его обоснования, а также пояснениями, какие выводы должен сделать пользователь и какие элементы фокусируют внимание именно на этих выводах, 2) презентации ключевых моментов исследования с ответами на вопросы преподавателя/комиссии.
- Проект по анализу данныхПроект по анализу данных. Данные для задания предоставляются преподавателем или обсуждаются в индивидуальном порядке. Работа выполняется индивидуально. Студенты должны применить на конкретных данных методы обработки и визуализации данных, изученные на семинарах. Проект должен быть написан с ориентацией на “заказчика”, то есть понятен потенциальному клиенту, содержать все необходимые пояснения и интерпретации. Результаты представляются в виде 1) отчета с таблицами / графиками и пояснениями, какие выводы должен сделать пользователь и какие элементы фокусируют внимание именно на этих выводах, 2) презентации ключевых моментов исследования с ответами на вопросы преподавателя/комиссии.
- Контрольная работа по курсу
Промежуточная аттестация
- 2024/2025 3rd module0.25 * Контрольная работа по курсу + 0.35 * Проект по анализу данных + 0.25 * Проект по основам машинного обучения + 0.15 * Упражнения
Список литературы
Рекомендуемая основная литература
- McKinney, W. (2018). Python for Data Analysis : Data Wrangling with Pandas, NumPy, and IPython (Vol. Second edition). Sebastopol, CA: O’Reilly Media. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=1605925
- Python for data analysis : data wrangling with pandas, numPy, and IPhython, Mckinney, W., 2017
Рекомендуемая дополнительная литература
- Bernard, J. (2016). Python Recipes Handbook : A Problem-Solution Approach. [United States]: Apress. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=1174476
- Downey, A. (2012). Think Python. Sebastopol, CA: O’Reilly Media. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=477161