Бакалавриат
2020/2021
Статистический анализ в Python
Лучший по критерию «Полезность курса для расширения кругозора и разностороннего развития»
Лучший по критерию «Новизна полученных знаний»
Статус:
Курс по выбору (Прикладная математика)
Направление:
01.03.04. Прикладная математика
Кто читает:
Департамент прикладной математики
Когда читается:
3-й курс, 3 модуль
Формат изучения:
без онлайн-курса
Преподаватели:
Поляков Константин Львович
Язык:
русский
Кредиты:
4
Контактные часы:
40
Программа дисциплины
Аннотация
Курс "Статистический анализ в Python" ориентирован на студентов, образование которых связано с анализом данных и/или они планируют использовать анализ данных в своей будущей профессиональной деятельности. Свободно распространяемая платформа CPython и различные проекты, основанные на ней (библиотеки) предоставляют богатые возможности для анализа данных без увеличения стоимости образования и/или коммерческих проектов. В рамках курса студенты познакомяться с вычислительными возможностями платформы и наиболее значимых библиотек, приобретут навыки самостоятельного использования языка Python и различных прикладных библиотек для проведения статистчиеского анализа данных и создания проблемно ориентированных приложений.
Цель освоения дисциплины
- Формирование у студентов навыков самостоятельной реализации элементарных проектов, связанных с управлением данными— организацией сбора и хранения данных, выбором данных по определенным критериям, содержащим несколько условий, модификацией данных, обменом данными между различными приложениями, интеграцией данных, полученных из различных источников.
- Формирование у студентов навыков самостоятельной реализации элементарных проектов, связанных с элементарным анализом данных — числовым анализом: подсчетом описательных числовых статистик адекватных типу данных, графическим анализом: визуализацией статистических свойств данных.
- Формирование у студентов навыков самостоятельной реализации элементарных проектов, связанных со статистическим анализом данных.
Планируемые результаты обучения
- Знать грамматику языка Python 3 (текущая версия) и стандарты разработки приложений на языке Python 3 (текущая версия).
- Знать основные функции системной библиотеки Python 3 (текущая версия).
- Знать структуру (основные разделы) библиотеки NumPy(текущая версия).
- Уметь использовать библиотеку NumPy (текущая версия) для организации хранения данных и управления данными.
- Уметь использовать библиотеку NumPy (текущая версия) для организации предварительного анализа данных.
- Знать структуру (основные разделы) библиотеки matplotlib (текущая версия).
- Учесть использовать библиотеку matplotlib для графического анализа данных
- Знать структуру (основные разделы) библиотеки Pandas(текущая версия).
Содержание учебной дисциплины
- Основы языка PythonГрамматика языка Pyhton. Структуры для хранения данных, управляющие конструкции. Создание функций и классов.
- Аналитические возможности библиотеки NumPyФункционал библиотеки NumPy, связанный с реализацией математических вычислений, в частности, статистического анализа и генерацией псевдо случайных величин.
- Использование библиотеки Pandas для хранения и анализа данныхКласс pandas.Series. Атрибуты и методы. Класс pandas.DataFrame. Атрибуты и методы. Методы объединения и группировки данных. Визуализация данных в pandas.
- Основы визуализации данных в библиотеке matplotlibОсновные элементы и параметры визуализаций в matplotlib. Использование matplotlib.pyplot. Объектно-ориентированный подход к созданию визуализаций
- Использованеи библиотеки Statsmodels для статистического анализа данныхStatistics stats, Nonparametric Methods, Empirical Likelihood, Distributions, Graphics
Элементы контроля
- Задание для самостоятельной работыВ отдельных случаях, при наличии у студента знаний в области разработки приложений на языке Python и по согласованию с преподавателем, студент может выполнить проект по индивидуальному техническому заданию повышенной сложности. В этом случае оценка за курс (промежуточная аттестация) проставляется по результатам оценивания его проекта.
- Работа на семинарахТекущая оценка TO=10 Score/Score_max , где Score — сумма баллов, полученная за работу на семинарах. Score_max — максимальная сумма баллов в группе