Бакалавриат
2021/2022





Python для извлечения и обработки данных
Статус:
Курс обязательный (Химия)
Направление:
04.03.01. Химия
Где читается:
Факультет химии
Когда читается:
2-й курс, 4 модуль
Формат изучения:
с онлайн-курсом
Онлайн-часы:
50
Охват аудитории:
для своего кампуса
Язык:
русский
Кредиты:
4
Контактные часы:
20
Программа дисциплины
Аннотация
Язык программирования Python является одним из самых простых в освоении и популярных языков программирования. Данный язык является мощным инструментом анализа данных и может повысить эффективность практически любой деятельности в науке и индустрии. С помощью языка Python можно автоматизировать рутинные операции и обрабатывать объемы данных, на несколько порядков превышающие объемы, доступные для обработки вручную или с помощью электронных таблиц. С использованием онлайн-курса Python как иностранный.
Цель освоения дисциплины
- Овладение навыками программирования на языке Python, овладение методами сбора и обработки данных для решения задач компьютерной химии
Планируемые результаты обучения
- Обладает навыками web-scraping
- Умеет работать с текстом, структурированными файлами (csv), xlsx-файлами и листами в них
- Знает этапы предварительной обработки текста и умеет реализовывать их на практике
- Умеет загружать файлы с данными; выполняет обработку табличных данных средствами Python
- Умеет писать функции на Python и тестировать их
- Умеет работать в среде Jupyter Notebook, умеет создавать переменные разных типов
- Умеет решать прикладные задачи с применением условных конструкций и циклов
- Знает особенности типов и структур данных: словарь, список, кортеж, множество, вложенные структуры, float, int, строка
- Умеет загружать файлы с данными разных форматов (cvs, txt)
Содержание учебной дисциплины
- Начало работы в Python
- Управляющие конструкции в Python
- Циклы в Python
- Структуры данных в Python
- Функции в Python
- Обработка текстовых файлов и электронных таблиц
- Работа с текстами
- Массивы NumPy
- Обработка web-страниц
- Питон для химии: RDKit и ChemP
Элементы контроля
- Экзамен
- Практика на семинарахОценка за дисциплину выставляется в соответствии с формулой оценивания от всех пройденных элементов контроля
- ПроектПредусматривается устная защита
- Защита проекта
Промежуточная аттестация
- 2021/2022 учебный год 4 модуль0.2 * Практика на семинарах + 0.15 * Защита проекта + 0.4 * Экзамен + 0.25 * Проект
Список литературы
Рекомендуемая основная литература
- Learning Python : [covers Python 2.5], Lutz, M., 2008
- Lutz, M. (2008). Learning Python (Vol. 3rd ed). Beijing: O’Reilly Media. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=415392
Рекомендуемая дополнительная литература
- Vanderplas, J. T. (2016). Python Data Science Handbook : Essential Tools for Working with Data (Vol. First edition). Sebastopol, CA: Reilly - O’Reilly Media. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=nlebk&AN=1425081