• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта
Бакалавриат 2020/2021

Статистический анализ в Python

Лучший по критерию «Полезность курса для расширения кругозора и разностороннего развития»
Лучший по критерию «Новизна полученных знаний»
Статус: Курс по выбору (Прикладная математика)
Направление: 01.03.04. Прикладная математика
Когда читается: 3-й курс, 3 модуль
Формат изучения: без онлайн-курса
Язык: русский
Кредиты: 4
Контактные часы: 40

Программа дисциплины

Аннотация

Курс "Статистический анализ в Python" ориентирован на студентов, образование которых связано с анализом данных и/или они планируют использовать анализ данных в своей будущей профессиональной деятельности. Свободно распространяемая платформа CPython и различные проекты, основанные на ней (библиотеки) предоставляют богатые возможности для анализа данных без увеличения стоимости образования и/или коммерческих проектов. В рамках курса студенты познакомяться с вычислительными возможностями платформы и наиболее значимых библиотек, приобретут навыки самостоятельного использования языка Python и различных прикладных библиотек для проведения статистчиеского анализа данных и создания проблемно ориентированных приложений.
Цель освоения дисциплины

Цель освоения дисциплины

  • Формирование у студентов навыков самостоятельной реализации элементарных проектов, связанных с управлением данными— организацией сбора и хранения данных, выбором данных по определенным критериям, содержащим несколько условий, модификацией данных, обменом данными между различными приложениями, интеграцией данных, полученных из различных источников.
  • Формирование у студентов навыков самостоятельной реализации элементарных проектов, связанных с элементарным анализом данных — числовым анализом: подсчетом описательных числовых статистик адекватных типу данных, графическим анализом: визуализацией статистических свойств данных.
  • Формирование у студентов навыков самостоятельной реализации элементарных проектов, связанных со статистическим анализом данных.
Планируемые результаты обучения

Планируемые результаты обучения

  • Знать грамматику языка Python 3 (текущая версия) и стандарты разработки приложений на языке Python 3 (текущая версия).
  • Знать основные функции системной библиотеки Python 3 (текущая версия).
  • Знать структуру (основные разделы) библиотеки NumPy(текущая версия).
  • Уметь использовать библиотеку NumPy (текущая версия) для организации хранения данных и управления данными.
  • Уметь использовать библиотеку NumPy (текущая версия) для организации предварительного анализа данных.
  • Знать структуру (основные разделы) библиотеки matplotlib (текущая версия).
  • Учесть использовать библиотеку matplotlib для графического анализа данных
  • Знать структуру (основные разделы) библиотеки Pandas(текущая версия).
Содержание учебной дисциплины

Содержание учебной дисциплины

  • Основы языка Python
    Грамматика языка Pyhton. Структуры для хранения данных, управляющие конструкции. Создание функций и классов.
  • Аналитические возможности библиотеки NumPy
    Функционал библиотеки NumPy, связанный с реализацией математических вычислений, в частности, статистического анализа и генерацией псевдо случайных величин.
  • Использование библиотеки Pandas для хранения и анализа данных
    Класс pandas.Series. Атрибуты и методы. Класс pandas.DataFrame. Атрибуты и методы. Методы объединения и группировки данных. Визуализация данных в pandas.
  • Основы визуализации данных в библиотеке matplotlib
    Основные элементы и параметры визуализаций в matplotlib. Использование matplotlib.pyplot. Объектно-ориентированный подход к созданию визуализаций
  • Использованеи библиотеки Statsmodels для статистического анализа данных
    Statistics stats, Nonparametric Methods, Empirical Likelihood, Distributions, Graphics
Элементы контроля

Элементы контроля

  • неблокирующий Задание для самостоятельной работы
    В отдельных случаях, при наличии у студента знаний в области разработки приложений на языке Python и по согласованию с преподавателем, студент может выполнить проект по индивидуальному техническому заданию повышенной сложности. В этом случае оценка за курс (промежуточная аттестация) проставляется по результатам оценивания его проекта.
  • неблокирующий Работа на семинарах
    Текущая оценка TO=10 Score/Score_max , где Score — сумма баллов, полученная за работу на семинарах. Score_max — максимальная сумма баллов в группе
Промежуточная аттестация

Промежуточная аттестация

  • Промежуточная аттестация (3 модуль)
    0.6 * Задание для самостоятельной работы + 0.4 * Работа на семинарах
Список литературы

Список литературы

Рекомендуемая основная литература

  • Python для сложных задач: наука о данных и машинное обучение : пер. с англ., Плас, Дж. Вандер, 2019

Рекомендуемая дополнительная литература

  • Python и анализ данных, Маккинли, У., 2015