Бакалавриат
2024/2025
Анализ данных в Python
Статус:
Курс обязательный (Юриспруденция)
Направление:
40.03.01. Юриспруденция
Где читается:
Факультет менеджмента (Пермь)
Когда читается:
3-й курс, 1 модуль
Формат изучения:
без онлайн-курса
Охват аудитории:
для своего кампуса
Преподаватели:
Сенина Анна Васильевна
Язык:
русский
Кредиты:
3
Контактные часы:
40
Программа дисциплины
Аннотация
Курс «Анализ данных в Python» направлен на формирование у студентов компетенций, необходимых для решения основных задач анализа экономических данных с применением современных инструментальных средств (язык программирования Python и его библиотеки). Курс включает в себя знакомство с основами применения Python для манипуляций с рядами и табличными данными, выявления закономерностей в данных, построения моделей машинного обучения и решения иных задач анализа данных и Data Science в целом.
Цель освоения дисциплины
- Целью освоения дисциплины «Анализ данных» является овладение студентами основами статистики и анализа данных для применения в решении различных практических задач.
Планируемые результаты обучения
- Понимать и корректно использовать основные статистические понятия
- Фильтровать данные по нескольким условиям
- Создавать сводные таблицы
- Вычислять коэффициент корреляции Пирсона и интерпретировать полученные результаты
- Вычислять релевантные описательные статистики и интерпретировать полученные результаты
- Визуализировать данные с помощью простейших видов диаграмм: линейной, точечной, столбчатой
- Сортировать данные
- Переводить значения признака в z-оценки
- Обрабатывать пропущенные значения и выбросы
- Строить уравнение линейной регрессии с использованием метода наименьших квадратов
- Корректно открывать табличные данные различных форматов
- Использовать собственноручно написанные функции для обработки данных, создания новых переменных
- Вычислять описательные статистики и интерпретировать полученные результаты
- Использовать Excel или Python в применении к анализу данных
Содержание учебной дисциплины
- Введение в инструменты
- Введение в статистику. Базовые манипуляции с данными
- Типы данных. Создание новых переменных
- Генеральная совокупность и выборка. Частотные таблицы и распределения
- Описательные статистики: меры центральной тенденции и разброса
- Z-оценка. Выбросы.
- Корреляция
- Введение в визуализацию данных
- Линейная регрессия
Элементы контроля
- Контрольная работа (НЭ)_ 2
- Исследовательский проект
- Практические работы на семинарах
- Мини-тесты на лекциях
- Контрольная работа (НЭ)_ 1
Промежуточная аттестация
- 2024/2025 1st module0.2 * Исследовательский проект + 0.25 * Контрольная работа (НЭ)_ 1 + 0.25 * Контрольная работа (НЭ)_ 2 + 0.1 * Мини-тесты на лекциях + 0.2 * Практические работы на семинарах
Список литературы
Рекомендуемая основная литература
- Elementary statistics : a step by step approach, Bluman, A. G., 2007
- Frederick J Gravetter, Larry B. Wallnau, Lori-Ann B. Forzano, & James E. Witnauer. (2020). Essentials of Statistics for the Behavioral Sciences, Edition 10. Cengage Learning.
- Python — это просто. Пошаговое руководство по программированию и анализу данных: Пер. с англ. - 978-5-9775-6849-4 - Нисчал Н. - 2022 - Санкт-Петербург: БХВ-Петербург - https://ibooks.ru/bookshelf/386516 - 386516 - iBOOKS
- Python для data science. - 978-5-4461-2392-6 - Васильев Юлий - 2023 - Санкт-Петербург: Питер - https://ibooks.ru/bookshelf/390133 - 390133 - iBOOKS
- Маккинни, У. Python и анализ данных. Первичная обработка данных с применением pandas, NumPy и Jupiter : справочник / У. Маккинни , перевод с английского А. А. Слинкина. — 3-е изд. — Москва : ДМК Пресс, 2023. — 536 с. — ISBN 978-5-93700-174-0. — Текст : электронный // Лань : электронно-библиотечная система. — URL: https://e.lanbook.com/book/348086 (дата обращения: 00.00.0000). — Режим доступа: для авториз. пользователей.
Рекомендуемая дополнительная литература
- Статистика и котики, Савельев, В. В., 2018