• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта
Бакалавриат 2020/2021

Python для извлечения и обработки данных

Лучший по критерию «Новизна полученных знаний»
Статус: Курс обязательный (Психология)
Направление: 37.03.01. Психология
Когда читается: 1-й курс, 3, 4 модуль
Формат изучения: с онлайн-курсом
Преподаватели: Бурова Маргарита Борисовна, Волкова Ксения Владимировна
Язык: русский
Кредиты: 3
Контактные часы: 24

Программа дисциплины

Аннотация

Язык программирования Python является одним из самых простых в освоении и популярных языков программирования. Данный язык является мощным инструментом анализа данных и может повысить эффективность практически любой деятельности в науке и индустрии. С помощью языка Python можно автоматизировать рутинные операции и обрабатывать объемы данных, на несколько порядков превышающие объемы, доступные для обработки вручную или с помощью электронных таблиц. С использованием онлайн-курса "Python для извлечения и обработки данных" на платформе online.hse.ru.
Цель освоения дисциплины

Цель освоения дисциплины

  • Обучить студентов навыкам программирования на языке Python, а также базовым приёмам извлечения данных из сети интернет и различных типов файлов, и их обработки, необходимым для дальнейшего обучения и в работе по специальности
Планируемые результаты обучения

Планируемые результаты обучения

  • Решает задачи на ввод-вывод и целочисленную арифметику
  • Применяет логические выражения, условный оператор, оператор цикла while
  • Применяет списки, кортежи, множества, методы работы с отдельными элементами и всеми структурами
  • Применяет цикл for, функцию range, решает задачи с использованием локальных и глобальных переменных
  • Решает задачи на работу с вещественными числами, применяет функции работы со строками
  • Умеет работать с текстом, структурированными файлами (csv), xlsx-файлами и листами в них
Содержание учебной дисциплины

Содержание учебной дисциплины

  • Переменные и арифметические действия
    Ввод-вывод, естественные типы данных, строки и символы, форматированные строки
  • Логический тип данных и условный оператор
    Логические переменные, логические операции. Условный оператор, конструкции if-else, применение конструкции if…elif
  • Цикл while
    Цикл с условием, логические выражения в условии цикла while, бесконечный цикл, вложенные циклы while.
  • Введение в структурированные типы данных и цикл for
    Упорядоченные типы данных, работа с последовательностью. Использование цикла for для просмотра списков и кортежей, перебора индексов и числовых промежутков, редактирования списков. Вложенный for и хранение информации в нескольких списках
  • Методы
    Методы строк. Редактирование строки с помощью цикла for. Методы списков. Превращение строки в список. Срезы с параметрами.
  • Неупорядоченные типы данных
    Введение в неупорядоченные типы данных. Операции над множествами. Добавление элементов в словарь и поиск по словарю.
  • Вложенные структуры данных. Сортировки
    Словари списков. Сортировка, минимум и максимум последовательностей. Подсчёт статистики с помощью словарей. Сортировка, минимум и максимум словарей. Словари словарей
  • Функции
    Разбиение программы на функции. Использование библиотек
  • Текстовые файлы и таблицы
    Чтение из файла и запись в файл, работа с текстовыми файлами. Работа с csv-файлами, анализ числовых данных
  • Web-скрейпинг
    Введение в устройство сайтов. Запрос страницы из сети, подсчёт статистики употребления слов на странице сайта. Извлечение данных из таблиц
Элементы контроля

Элементы контроля

  • неблокирующий Онлайн-курс
  • неблокирующий Домашнее задание 1
    Задание по материалам разделов 1-3
  • неблокирующий Домашнее задание 2
    Задание по материалам разделов 4-6
  • неблокирующий Домашнее задание 3
    Задание по материалам разделов 7-9
  • неблокирующий Активность на семинарах
Промежуточная аттестация

Промежуточная аттестация

  • Промежуточная аттестация (4 модуль)
    0.25 * Активность на семинарах + 0.2 * Домашнее задание 1 + 0.2 * Домашнее задание 2 + 0.2 * Домашнее задание 3 + 0.15 * Онлайн-курс
Список литературы

Список литературы

Рекомендуемая основная литература

  • Lutz, M. (2008). Learning Python (Vol. 3rd ed). Beijing: O’Reilly Media. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=415392

Рекомендуемая дополнительная литература

  • Vanderplas, J. T. (2016). Python Data Science Handbook : Essential Tools for Working with Data (Vol. First edition). Sebastopol, CA: Reilly - O’Reilly Media. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=nlebk&AN=1425081