2022/2023





Основы программирования на языке Python
Статус:
Маго-лего
Кто читает:
Департамент мировой экономики
Когда читается:
3 модуль
Онлайн-часы:
50
Охват аудитории:
для своего кампуса
Преподаватели:
Перевышина Татьяна Олеговна
Язык:
русский
Кредиты:
3
Контактные часы:
20
Программа дисциплины
Аннотация
На сегодняшний день Python является стандартом индустрии для анализа данных. По окончании этого курса, студенты получат в свое распоряжение набор аналитических инструментов, которые им пригодятся как в академии, так и при работе в частном или государственном секторе. Целью этого курса является развитие навыков программирования и создание крепкой практической базы для поиска, анализа и презентации данных. Также мы познакомимся с задачами и алгоритмами машинного обучения, что задаст вектор развития для тех студентов, которые захотят углубиться в предмет. С использованием онлайн-курса, размещенного на online.hse.ru.
Цель освоения дисциплины
- Развитие и закрепление навыков программирования на языке Python.
- Формирование и развитие навыков работы со специализированными библиотеками для обработки, визуализации и анализа данных (pandas, plotly, matplotlib, twitter api).
- Развитие навыков работы с данными: поиск, сбор, обработка, визуализация, разведывательный анализ.
- Знакомство с клиент-серверной архитектурой приложений для самостоятельного поиска данных.
- Освоение терминологии области машинного обучения и знакомство с базовыми алгоритмами.
- Развитие навыков постановки исследовательской задачи и выполнение тестового проекта.
Планируемые результаты обучения
- Уверенно пользуется языком Python для решения аналитических задач
- Выбирает корректные графики для визуализации данных
- Выбирает правильный тип визуализации для решения конкретной задачи
- Загружает данные в pandas и работает с ними (фильтрация, агрегация, заполнение пропущенных значений)
- Использует API различных сайтов для скачивания данных
- Настраивает внешний вид графиков в библиотеках Python для визуализации
- Определяет тип задачи машинного обучения, выбирает корректные модели для ее решения, осуществляет подбор параметров и выбирает лучшую модель
- Проводит разведывательный анализ данных
- Проводит разведывательный анализ данных с помощью визуализаций
- Реализовывает простые алгоритмы машинного обучения
- Решает задачи машинного обучения от постановки исследовательского вопроса до интерпретации результатов
- Решает простые задачи классификации, регрессии
- Умеет пользоваться программным интерфейсом приложений (API) для поиска необходимых данных
Содержание учебной дисциплины
- Основы программирование в Python
- Управляющие конструкции в Python.
- Циклы в Python
- Структуры данных в Python
- Функции в Python
- Работа с файлами
- Работа с API
- Визуализация данных
- Введение в машинное обучение
- Массивы NumPy и работа с таблицами
Элементы контроля
- Контрольная работа №2
- Контрольная работа №1
- ПроектПроект представляет собой написание корректно работающей программы прикладного назначения с последующей устной защитой в виде презентации. Проект включает в себя следующие части: программа Python (файл с расширением .py или файл Jupyter Notebook с расширением .ipynb), pdf-файл с описанием назначения и принципов работы программы (документация) и презентация, включающая публичную демонстрацию работы программы. Проект обязательно должен включать использование навыков, полученных в результате прохождения тем курса, то есть выгрузку данных с веб-страницы или с помощью API, сохранение данных в датафрейм pandas с последующей их обработкой. Проект выполняется индивидуально. Оценка за проект определяется по следующей формуле (способ округления – стандартный арифметический): Проект = 0.15 * План + 0.4 * Программа + 0.15 * Документация + + 0.3 * Презентация).
- Онлайн-курс
- ЭкзаменЭкзамен устный в Zoom. Без прокторинга. На экзамене можно пользоваться всеми своими материалами. Возможно выставление оценки автоматом. Технические требования: web-камера, микрофон, наушники / колонки, Zoom
Промежуточная аттестация
- 2022/2023 учебный год 3 модуль0.15 * Контрольная работа №1 + 0.25 * Онлайн-курс + 0.2 * Экзамен + 0.2 * Проект + 0.2 * Контрольная работа №2
Список литературы
Рекомендуемая основная литература
- Muller, A. C., & Guido, S. (2017). Introduction to machine learning with Python: a guide for data scientists. O’Reilly Media. (HSE access: http://ebookcentral.proquest.com/lib/hselibrary-ebooks/detail.action?docID=4698164)
Рекомендуемая дополнительная литература
- Mirkin, B. Core concepts in data analysis: summarization, correlation and visualization. – Springer Science & Business Media, 2011. – 388 pp.
- Miroslav Kubat. An Introduction to Machine Learning. Springer, 2015 (296 pages) ISBN: 9783319200095: — Текст электронны // ЭБС books24x7 — https://library.books24x7.com/toc.aspx?bookid=117295
- Witten, I. H. et al. Data Mining: Practical machine learning tools and techniques. – Morgan Kaufmann, 2017. – 654 pp.
- Мастицкий, С. Э. Визуализация данных с помощью ggplot2 / С. Э. Мастицкий. — Москва : ДМК Пресс, 2017. — 222 с. — ISBN 978-5-97060-470-0. — Текст : электронный // Лань : электронно-библиотечная система. — URL: https://e.lanbook.com/book/107895 (дата обращения: 00.00.0000). — Режим доступа: для авториз. пользователей.
- Основы алгоритмизации и программирования на Python : учеб. пособие / С.Р. Гуриков. — М. : ФОРУМ : ИНФРА-М, 2020. — 343 с. — (Среднее профессиональное образование). - Режим доступа: http://znanium.com/catalog/product/1042452