Магистратура
2020/2021
Анализ данных на Python в примерах и задачах - 2
Лучший по критерию «Полезность курса для Вашей будущей карьеры»
Лучший по критерию «Полезность курса для расширения кругозора и разностороннего развития»
Лучший по критерию «Новизна полученных знаний»
Статус:
Курс по выбору (Промышленное программирование)
Направление:
01.04.02. Прикладная математика и информатика
Кто читает:
Департамент информатики
Когда читается:
2-й курс, 1, 2 модуль
Формат изучения:
без онлайн-курса
Преподаватели:
Краско Евгений Сергеевич
Прогр. обучения:
Промышленное программирование
Язык:
русский
Кредиты:
4
Контактные часы:
44
Программа дисциплины
Аннотация
Является дисциплиной по выбору. Целями освоения дисциплины являются: • приобретение студентами практического навыка построения и анализа алгоритмов, а также навыка самостоятельной их реализации посредством программирования на современных языках программирования (на примере Python) и в специализированных пакетах (R). • формирование понимания технологии работы со сложными структурами программ и данных. • формирование представления о парадигмах программирования в специализированных средах. • развитие навыков практического программирования и анализа данных как на примере стандартных задач программирования (работа с деревьями, графами, обработка списков и массивов, символьное преобразование), так и в приложении к решению практических задач. • формирование основы для дальнейшего применения в области математического и компьютерного моделирования сложных социально-экономических систем и процессов. Курс содержит следующие разделы: Основы программирования на языке Python; Основы технологического обеспечения анализа данных; Основы сбора, предварительной обработки и анализа данных в Python.
Цель освоения дисциплины
- • приобретение студентами практического навыка построения и анализа алгоритмов, а также навыка самостоятельной их реализации посредством программирования на совре-менных языках программирования (на примере Python) и в специализированных пакетах (R). • формирование понимания технологии работы со сложными структурами программ и данных. • формирование представления о парадигмах программирования в специализированных средах. • развитие навыков практического программирования и анализа данных как на примере стандартных задач программирования (работа с деревьями, графами, обработка списков и массивов, символьное преобразование), так и в приложении к решению практических задач. • формирование основы для дальнейшего применения в области математического и ком-пьютерного моделирования сложных социально-экономических систем и процессов.
Планируемые результаты обучения
- Знает историю создания языка Python. Владеет понятием о Python как динамически типизированном интерпретируемом языке программирования высокого уровня. Понимает особенности синтаксиса Python. Знает предложение о стиле форматирования программного кода PEP8. REPL и исполнение записанного в файл программного кода. Ознакомился с кратким обзором средств разработки на Python. Владеет понятием о синтаксисе Python.
- Умеет пользоваться командной строкой Linux. GNU coreutils. Знает распространённое ПО для работы на удалённых серверах; средства загрузки веб-страниц и файлов (по протоколу HTTP); системы управления версиями (git).
- Использование библиотеки numpy. Умение работать с разреженными матрицами с помощью scipy. Знает основы работы с табличными данными средствами pandas. Работа с реляционными базами данных и со структурированными/полуструктурированными данными в распространённых форматах. Знает регулярные выражения в Python.
- Изучение библиотеки scikit-learn, обзор решаемых задач. Умение построить цепочки обработки данных для решения задач предсказания. Изучение библиотеки nltk и обзор решаемых библиотекой задач.
Содержание учебной дисциплины
- Основы программирования на языке Python
- Основы технологического обеспечения анализа данных
- Основы сбора, предварительной обработки и анализа данных в Python
- Основы работы с данными, качественная и практическая задачи
Промежуточная аттестация
- Промежуточная аттестация (2 модуль)0.2 * Домашняя работа + 0.2 * Контрольная работа 1 + 0.2 * Контрольная работа 2 + 0.4 * Экзамен
Список литературы
Рекомендуемая основная литература
- Garreta, R., & Moncecchi, G. (2013). Learning Scikit-learn : Machine Learning in Python: Experience the Benefits of Machine Learning Techniques by Applying Them to Real-world Problems Using Python and the Open Source Scikit-learn Library. Birmingham, UK: Packt Publishing. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=673033
Рекомендуемая дополнительная литература
- Richert, W., & Coelho, L. P. (2013). Building Machine Learning Systems with Python. Birmingham: Packt Publishing. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=619996