Бакалавриат
2020/2021
Аналитика данных на Python
Лучший по критерию «Новизна полученных знаний»
Статус:
Курс обязательный (Экономика)
Направление:
38.03.01. Экономика
Кто читает:
Департамент экономики
Где читается:
Санкт-Петербургская школа экономики и менеджмента
Когда читается:
1-й курс, 3, 4 модуль
Формат изучения:
без онлайн-курса
Преподаватели:
Волкова Юлия Михайловна,
Ефимова Полина Романовна,
Красильников Александр Александрович,
Смирнова Анна Вадимовна
Язык:
русский
Кредиты:
4
Контактные часы:
48
Программа дисциплины
Аннотация
Дисциплина не предполагает наличия опыта программирования до начала изучения курса. В ходе изучения дисциплины студенту предлагается самостоятельное изучение азов программирования на языке Python с помощью онлайн курса «Программирование на Python» на платформе Stepik, доступной по адресу: https://stepik.org/course/67/syllabus . После изучения онлайн курса студентам будет предложено. В ходе изучения дисциплины на лекционных и семинарских занятиях студенту будут предложены дополнительные инструменты для формирования наборов данных, в том числе и инструменты для автоматизации загрузки данных из сети Интернет. Дисциплина может являться пререквизитом для изучения дисциплин «Эконометрика», «Статистика», а также для междисциплинарной курсовой работы и выпускной квалификационной работы.
Цель освоения дисциплины
- Подготовка выпускников к информационно-аналитической и научно-исследовательской деятельности в качестве исполнителей или руководителей младшего уровня
- на основе полученных в ходе освоения дисциплины знаний продолжение обучения в магистратуре и аспирантуре
Планируемые результаты обучения
- Узнать особенности языка программирования познакомиться со средой jupyter
- Знакомство с библиотекой pandas
- Знакомство с библиотекой requests, чтение и запись из файлов формата csv
- Знакомство с форматом json, владение типами list и dict
- Знакомство с регулярными выражениями
- Знакомство с парсингом HTML разметки сайтов
- Знакомство с соединением различных массивов данных
- Знакомство с SQL (Декларативный язык программирования, применяемый для создания, модификации и управления данными в реляционной базе данных, управляемой соответствующей системой управления базами данных.)
- Онлайн курс «Программирование на Python»
- Работа с библиотекой BeautifulSoup
Содержание учебной дисциплины
- Аналитика данных на PythonОбработка и преобразование большого количества неструктурированных или неорганизованных данных с целью генерирования ключевой информации об этих данных, которые могли бы помочь в принятии обоснованных решений с помощью языка программирования Python
Элементы контроля
- домашние заданияИндивидуальное задание для выполнения в рамках самостоятельной работы. В случае уменьшения числа домашних заданий, семинаров и летучек, баллы за не проведенные формы работы перераспределяются пропорционально между оставшимися работами той же формы работ
- семинарское заданиеЗадание на работу в малых группах (в случае аудиторной работы в классе) или индивидуально (в случае дистанционной работы) на семинарах.
- Контрольная работа 1Задание на лекции аналогичное экзаменационному.
- Контрольная работа 2Задание на лекции аналогичное экзаменационном.
- ЭкзаменПисьменная работа с заданиями
Промежуточная аттестация
- Промежуточная аттестация (4 модуль)0.2 * домашние задания + 0.1 * Контрольная работа 1 + 0.1 * Контрольная работа 2 + 0.2 * семинарское задание + 0.4 * Экзамен
Список литературы
Рекомендуемая основная литература
- Python Data Analytics поможет вам освоить мир сбора и анализа данных, используя всю мощь языка Python. В основе этой книги лежит описание pandas, библиотеки с открытым исходным кодом, лицензированной BSD, обеспечивающей высокопроизводительные, простые в использовании структуры данных и инструменты анализа данных для языка программирования Python. Автор Фабио Нелли мастерски демонстрирует силу языка программирования Python в применении к обработке, управлению и извлечению информации. Внутри вы увидите, насколько интуитивно понятным и гибким является обнаружение и передача значимых шаблонов данных с помощью скриптов Python, систем отчетности и экспорта данных. В этой книге рассматривается, как получать, обрабатывать, хранить, управлять и анализировать данные с помощью языка программирования Python. Вы будете использовать Python и другие инструменты с открытым исходным кодом для обработки данных и выявления интересных и важных тенденций в этих данных, которые позволят вам предсказывать будущее. узоры. Независимо от того, имеете ли вы дело с данными продаж, инвестиционными данными (акции, облигации и т. Д.), Медицинскими данными, использованием веб-страниц или любым другим типом набора данных, Python можно использовать для интерпретации, анализа и сбора информации из кучи числа и статистика. Эта книга является бесценным справочником с примерами хранения и доступа к данным в базе данных; он проведет вас через процесс создания отчета; в нем представлены три практических примера или примера, которые вы можете взять с собой для повседневного анализа.
Рекомендуемая дополнительная литература
- Автоматизация рутинных задач с помощью Python : практическое руководство для начинающих, Свейгарт, Э., 2018
- Вероятностное программирование на Python : байесовский вывод и алгоритмы, Дэвидсон - Пайлон, К., 2020
- Изучаем pandas : высокопроизводительная обработка и анализ данных в Python, Хейдт, М., 2018
- Прикладной анализ текстовых данных на Python : машинное обучение и создание приложений обработки естественного языка, Бенгфорт, Б., 2020