Бакалавриат
2020/2021
Python для извлечения и обработки данных
Лучший по критерию «Новизна полученных знаний»
Статус:
Курс обязательный (Иностранные языки и межкультурная коммуникация)
Направление:
45.03.02. Лингвистика
Где читается:
Школа иностранных языков
Когда читается:
2-й курс, 4 модуль
Формат изучения:
с онлайн-курсом
Преподаватели:
Бурова Маргарита Борисовна
Язык:
русский
Кредиты:
3
Контактные часы:
24
Программа дисциплины
Аннотация
Язык программирования Python является одним из самых простых в освоении и популярных языков программирования. Данный язык является мощным инструментом анализа данных и может повысить эффективность практически любой деятельности в науке и индустрии. С помощью языка Python можно автоматизировать рутинные операции и обрабатывать объемы данных, на несколько порядков превышающие объемы, доступные для обработки вручную или с помощью электронных таблиц. С использованием онлайн-курса, размещенного на online.hse.ru
Цель освоения дисциплины
- Обучить студентов навыкам программирования на языке Python, а также базовым приёмам извлечения данных из сети интернет и различных типов файлов, и их обработки, необходимым для дальнейшего обучения и в работе по специальности
Планируемые результаты обучения
- Решает задачи на работу с вещественными числами, применяет функции работы со строками
- Решает задачи на ввод-вывод и целочисленную арифметику
- Применяет логические выражения, условный оператор, оператор цикла while
- Применяет списки, кортежи, множества, словари, методы работы с отдельными элементами и всеми структурами
- Применяет цикл for, функцию range, решает задачи с использованием локальных и глобальных переменных
- Умеет работать с текстом, структурированными файлами (csv)
- Обладает навыками web-scraping
Содержание учебной дисциплины
- Введение в программирование. Переменные и арифметические действия.Ввод-вывод. Естественные типы данных и арифметические действия. Строки и символы. Форматированные строки.
- Условный оператор, цикл whileБлок-схемы и логические переменные. Логические выражения. Условный оператор, оператор цикла while
- Введение в структурированные данные и цикл forСписки и кортежи. Цикл for, функция range.
- Методы строк и списковСрезы. Поиск в строке. Основные методы списков. Преобразование строк в списки.
- Словари и множестваСловари, множества, методы работы с отдельными элементами и всеми структурами
- Функции и библиотекиНаписание собственных функций. Разбиение программы на функции. Локальные переменные. Загрузка функций из специализированных библиотек.
- Текстовые файлы и таблицыЧтение из файла и запись в файл. Работа с текстовыми файлами. Работа со структурированными файлами (csv).
- Обработка web-страницОсновы HTML, загрузка и обработка web-страниц, работа с тегами HTML, обработка ссылок и таблиц.
Промежуточная аттестация
- Промежуточная аттестация (4 модуль)0.25 * Домашнее задание 1 + 0.25 * Домашнее задание 2 + 0.25 * Онлайн курс + 0.25 * Экзамен
Список литературы
Рекомендуемая основная литература
- Lutz, M. (2008). Learning Python (Vol. 3rd ed). Beijing: O’Reilly Media. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=415392
Рекомендуемая дополнительная литература
- Vanderplas, J. T. (2016). Python Data Science Handbook : Essential Tools for Working with Data (Vol. First edition). Sebastopol, CA: Reilly - O’Reilly Media. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=nlebk&AN=1425081