Бакалавриат
2020/2021
Python для извлечения и обработки данных
Лучший по критерию «Новизна полученных знаний»
Статус:
Курс обязательный (Психология)
Направление:
37.03.01. Психология
Где читается:
Факультет социальных наук
Когда читается:
1-й курс, 3, 4 модуль
Формат изучения:
с онлайн-курсом
Язык:
русский
Кредиты:
3
Контактные часы:
24
Программа дисциплины
Аннотация
Язык программирования Python является одним из самых простых в освоении и популярных языков программирования. Данный язык является мощным инструментом анализа данных и может повысить эффективность практически любой деятельности в науке и индустрии. С помощью языка Python можно автоматизировать рутинные операции и обрабатывать объемы данных, на несколько порядков превышающие объемы, доступные для обработки вручную или с помощью электронных таблиц. С использованием онлайн-курса "Python для извлечения и обработки данных" на платформе online.hse.ru.
Цель освоения дисциплины
- Обучить студентов навыкам программирования на языке Python, а также базовым приёмам извлечения данных из сети интернет и различных типов файлов, и их обработки, необходимым для дальнейшего обучения и в работе по специальности
Планируемые результаты обучения
- Решает задачи на ввод-вывод и целочисленную арифметику
- Применяет логические выражения, условный оператор, оператор цикла while
- Применяет списки, кортежи, множества, методы работы с отдельными элементами и всеми структурами
- Применяет цикл for, функцию range, решает задачи с использованием локальных и глобальных переменных
- Решает задачи на работу с вещественными числами, применяет функции работы со строками
- Умеет работать с текстом, структурированными файлами (csv), xlsx-файлами и листами в них
Содержание учебной дисциплины
- Переменные и арифметические действияВвод-вывод, естественные типы данных, строки и символы, форматированные строки
- Логический тип данных и условный операторЛогические переменные, логические операции. Условный оператор, конструкции if-else, применение конструкции if…elif
- Цикл whileЦикл с условием, логические выражения в условии цикла while, бесконечный цикл, вложенные циклы while.
- Введение в структурированные типы данных и цикл forУпорядоченные типы данных, работа с последовательностью. Использование цикла for для просмотра списков и кортежей, перебора индексов и числовых промежутков, редактирования списков. Вложенный for и хранение информации в нескольких списках
- МетодыМетоды строк. Редактирование строки с помощью цикла for. Методы списков. Превращение строки в список. Срезы с параметрами.
- Неупорядоченные типы данныхВведение в неупорядоченные типы данных. Операции над множествами. Добавление элементов в словарь и поиск по словарю.
- Вложенные структуры данных. СортировкиСловари списков. Сортировка, минимум и максимум последовательностей. Подсчёт статистики с помощью словарей. Сортировка, минимум и максимум словарей. Словари словарей
- ФункцииРазбиение программы на функции. Использование библиотек
- Текстовые файлы и таблицыЧтение из файла и запись в файл, работа с текстовыми файлами. Работа с csv-файлами, анализ числовых данных
- Web-скрейпингВведение в устройство сайтов. Запрос страницы из сети, подсчёт статистики употребления слов на странице сайта. Извлечение данных из таблиц
Элементы контроля
- Онлайн-курс
- Домашнее задание 1Задание по материалам разделов 1-3
- Домашнее задание 2Задание по материалам разделов 4-6
- Домашнее задание 3Задание по материалам разделов 7-9
- Активность на семинарах
Промежуточная аттестация
- Промежуточная аттестация (4 модуль)0.25 * Активность на семинарах + 0.2 * Домашнее задание 1 + 0.2 * Домашнее задание 2 + 0.2 * Домашнее задание 3 + 0.15 * Онлайн-курс
Список литературы
Рекомендуемая основная литература
- Lutz, M. (2008). Learning Python (Vol. 3rd ed). Beijing: O’Reilly Media. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=415392
Рекомендуемая дополнительная литература
- Vanderplas, J. T. (2016). Python Data Science Handbook : Essential Tools for Working with Data (Vol. First edition). Sebastopol, CA: Reilly - O’Reilly Media. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=nlebk&AN=1425081