2022/2023
Сбор и анализ количественных данных в рекламе и PR
Лучший по критерию «Полезность курса для расширения кругозора и разностороннего развития»
Лучший по критерию «Новизна полученных знаний»
Статус:
Маго-лего
Кто читает:
Департамент социологии
Когда читается:
1, 2 модуль
Охват аудитории:
для своего кампуса
Преподаватели:
Ротмистров Алексей Николаевич
Язык:
русский
Кредиты:
6
Контактные часы:
44
Программа дисциплины
Аннотация
Курс посвящён основам языка программирования Python, применяемым для автоматизированного сбора данных (веб-скрапинга) и их анализа. Курс включает пакеты и модули Python, а также интерфейсы, позволяющие обращаться к API Youtube и использовать его методы для веб-скрапинга, структурировать собранные данные в формат Excel, применять описательную статистику и искать связи между парой переменных – с учётом их типов шкал.
Цель освоения дисциплины
- Научиться основам Python, изучить его пакеты и модули , а также интерфейсы, позволяющие обращаться к API Youtube и использовать его методы для веб-скрапинга, структурировать собранные данные в формат Excel, применять описательную статистику и искать связи между парой переменных -- с учётом их типов шкал.
Планируемые результаты обучения
- Умение посредством Python правильно авторизоваться в YouTube, создать клиент API YouTube и применить его для веб-скрапинга изучаемого YouTube-канала.
- Умение посредством Python правильно оформить характеристики видео с изучаемого YouTube-канала в удобную таблицу Excel.
- Умение применять к переменным релевантные методы описательной статистики (одномерные частотные таблицы и графики, меры центральной тенденции и неоднородности) -- с учётом их типов шкал.
- Умение применять к переменным релевантные методы парной связи (коэффициент корреляции Пирсона, коэффициент ранговой корреляции Спирмана, критерий Хи-квадрат и его остатки) -- с учётом их типов шкал; и интерпретировать результаты.
- Умение различать три основных типа шкал переменных (номинальные, порядковые, интервальные-числовые) на основе ориентиров.
Содержание учебной дисциплины
- Основы веб-скрапинга: API YouTube и программная среда Python.
- Основы работы с выгрузкой результатов веб-скрапинга.
- Типы шкал, траектории анализа данных.
- Методы описательной статистики с учётом типов шкал.
- Методы парной связи с учётом типов шкал.
Элементы контроля
- Два домашних заданияСбор данных в рамках персонального (или в команде до четырёх человек) мини-проекта и их первичный анализ
- ЭкзаменЭкзамен в формате теста
- Активность на занятииАктивность на занятиях; выставляется на каждом занятии за обоснованные ответы
Промежуточная аттестация
- 2022/2023 учебный год 2 модуль0.23 * Два домашних задания + 0.35 * Экзамен + 0.22 * Два домашних задания + 0.1 * Активность на занятии
Список литературы
Рекомендуемая основная литература
- Harish Garg. (2018). Mastering Exploratory Analysis with Pandas : Build an End-to-end Data Analysis Workflow with Python. Packt Publishing.
Рекомендуемая дополнительная литература
- Fink, C. (2020). metatube: Python script to download YouTube metadata. https://doi.org/10.5281/zenodo.3773303
- McKinney, W. (2018). Python for Data Analysis : Data Wrangling with Pandas, NumPy, and IPython (Vol. Second edition). Sebastopol, CA: O’Reilly Media. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=1605925