We use cookies in order to improve the quality and usability of the HSE website. More information about the use of cookies is available here, and the regulations on processing personal data can be found here. By continuing to use the site, you hereby confirm that you have been informed of the use of cookies by the HSE website and agree with our rules for processing personal data. You may disable cookies in your browser settings.

  • A
  • A
  • A
  • ABC
  • ABC
  • ABC
  • А
  • А
  • А
  • А
  • А
Regular version of the site

Programming for Data Science

2024/2025
Academic Year
RUS
Instruction in Russian
3
ECTS credits
Delivered at:
School of Communication
Course type:
Compulsory course
When:
1 year, 2 module

Instructor


Пеньков Антон Андреевич

Программа дисциплины

Аннотация

Дисциплина «Программирование для анализа данных» направлена на получение студентами практических навыков программирования на Python, работы в среде интерактивной разработки Jupyter Notebook, обработки, анализа и визуализации данных с помощью библиотеки Pandas, необходимых для дальнейшего изучения и применения машинного обучения и искусственного интеллекта при решении задач профессиональной деятельности в области цифровых коммуникаций.
Цель освоения дисциплины

Цель освоения дисциплины

  • Целями освоения дисциплины «Программирование для анализа данных» являются: - овладение навыками программирования на языке Python; - овладение навыками работы в среде интерактивной разработки Jupyter Notebook; - овладение методами обработки, анализа и визуализации качественных и количественных данных для решения прикладных задач, возникающих в сфере управления интегрированными коммуникациями и маркетинга.
Планируемые результаты обучения

Планируемые результаты обучения

  • Использует библиотеку pandas для анализа данных
  • Работает в интерфейсе Jupyter Notebook, использует переменные и базовые объекты в Python
  • Выполняет анализ и визуализацию данных в Python
  • Парсит данные с веб-страниц
Содержание учебной дисциплины

Содержание учебной дисциплины

  • Тема 1. Введение в работу с Python и Jupyter Notebook.
  • Тема 2. Основы работы с библиотекой Pandas.
  • Разведывательный анализ данных в Python. Визуализация количественных и качественных данных в Python. Визуализация данных с помощью Pandas.
  • Работа с API. Парсинг HTML-страниц.
Элементы контроля

Элементы контроля

  • неблокирующий Групповое задание
    Групповое задание на парсинг данных
  • неблокирующий Домашние задания
  • неблокирующий Практическая работа
    Выполнение упражнений на занятии
Промежуточная аттестация

Промежуточная аттестация

  • 2024/2025 2nd module
    0.4 * Групповое задание + 0.4 * Домашние задания + 0.2 * Практическая работа
Список литературы

Список литературы

Рекомендуемая основная литература

  • Python для data science. - 978-5-4461-2392-6 - Васильев Юлий - 2023 - Санкт-Петербург: Питер - https://ibooks.ru/bookshelf/390133 - 390133 - iBOOKS

Рекомендуемая дополнительная литература

  • Hajba G.L. Website Scraping with Python: Using BeautifulSoup and Scrapy / G.L. Hajba, Berkeley, CA: Apress, 2018.
  • McKinney, W. (2018). Python for Data Analysis : Data Wrangling with Pandas, NumPy, and IPython (Vol. Second edition). Sebastopol, CA: O’Reilly Media. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=1605925
  • Seppe vanden Broucke, & Bart Baesens. (2018). Practical Web Scraping for Data Science : Best Practices and Examples with Python. Apress.

Авторы

  • Грызунова Елена Аркадьевна
  • Коваленко Надежда Николаевна