• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта
Магистратура 2023/2024

Программирование и анализ данных

Лучший по критерию «Полезность курса для Вашей будущей карьеры»
Лучший по критерию «Полезность курса для расширения кругозора и разностороннего развития»
Лучший по критерию «Новизна полученных знаний»
Статус: Курс обязательный (Современная журналистика)
Направление: 42.04.02. Журналистика
Кто читает: Институт медиа
Когда читается: 2-й курс, 1, 2 модуль
Формат изучения: без онлайн-курса
Охват аудитории: для своего кампуса
Преподаватели: Покатилов Роман Алексеевич
Прогр. обучения: Современная журналистика
Язык: русский
Кредиты: 6
Контактные часы: 52

Программа дисциплины

Аннотация

Курс «Программирование и анализ данных» является обязательным курсом на образовательной программе «Журналистика данных». Курс состоит из трех блоков. Первый блок включает базовые элементы языка программирования Python, второй блок представляет собой знакомство с инструментами обработки, визуализации и разведывательного анализа данных в Python, третий блок посвящен выгрузке информации из веб-страниц и баз данных, а также основам работы с открытыми данными.
Цель освоения дисциплины

Цель освоения дисциплины

  • Целями освоения дисциплины являются овладение навыками программирования на языке Python, овладение методами сбора и обработки данных для решения задач дата-журналистики, овладение элементами веб-дизайна для визуализации данных и создания собственных проектов.
  • Изучить методы работы с табличными данными в python.
  • Освоить методы функционального и объектно-ориентированного программирования на языке Python.
  • Познакомить слушателей курса с современными СУБД и научиться применять их в учебных проектах.
  • Научиться писать программы для автоматизированного сбора данных веб-сайтов (в частности, социальных сетей) и мессенджеров.
  • Изучить базовые алгоритмы машинного обучения для решения задач регрессии, классификации и кластеризации.
Планируемые результаты обучения

Планируемые результаты обучения

  • Знать особенности работы с современными дистрибутивами Python
  • Знает этапы предварительной обработки текста и умеет реализовывать их на практике
  • Применяет готовые функции Python, пишет собственные функции на Python, умеет работать с классами, описывает собственные объекты в Python и определяет методы на них
  • Программа для сбора открытых данных
  • Программа на языке Python для работы с базами данных
  • Реализация REST интерфейс
  • Умеет выполнять операции с массивами NumPy
  • Умеет загружать и сохранять файлы с данными различных форматов
  • Умеет загружать файлы с данными; выполняет обработку табличных данных средствами Python
  • Умеет работать в среде Jupyter Notebook, создает переменные разных типов, выполняет приведение типов
  • Умеет решать прикладные задачи с применением циклов
  • Умеет создавать списки, кортежи, множества и словари в Python, обращаться к их элементам и изменять их
  • Умеет создавать списки, решает прикладные задачи с применением условных конструкций
  • Умеет строить графики математических функций и визуализировать данные в Python, знает этапы разведывательного анализа данных и умеет реализовывать их на практике
  • Применяет готовые функции Python, пишет собственные функции на Python, умеет работать с классами, описывает собственные объекты в Python и определяет методы на них.
  • Умеет загружать и сохранять файлы с данными различных форматов.
  • Уверенно пишет программы автоматического сбора данных в том числе динамических web-сайтов и мессенджеров.
  • Умеет применять post-запросы для сбора данных.
  • Знает этапы предварительной обработки текста и умеет реализовывать их на практике.
  • Знает этапы разведывательного анализа данных и умеет реализовывать их на практике.
  • Уверенно проводит очистку данных инструментами библиотеки Pandas.
  • Программировать на языке Python для работы с базами данных.
  • Применяет систему контроля версий Git.
  • Решает задачи машинного обучения (регрессия, классификация или кластеризация данных) на практике.
  • Знает основные этапы вёрстки в html и css.
Содержание учебной дисциплины

Содержание учебной дисциплины

  • Начало работы в Python
  • Управляющие конструкции в Python
  • Структуры данных в Python
  • Циклы в Python
  • Функции и классы в Python
  • Работа с файлами
  • Работа с текстами
  • Массивы NumPy
  • Работа с таблицами
  • Визуализация и разведывательный анализ данных
  • Высокопроизводительные дистрибутивы Python
  • Веб-программирование с помощью Python
  • Открытые данные
  • Современные СУБД
  • Функциональное программирование на Python
  • Основы ООП в Python
  • Операции над массивами и инструменты NumPy
  • Работа с табличными данными в Pandas
  • Автоматический сбор данных с web-сайтов
  • Автоматический сбор данных из социальных сетей и мессенджеров
  • Введение в современные СУБД
  • Алгоритмы машинного обучения
  • Основы вёртски (html, css)
Элементы контроля

Элементы контроля

  • неблокирующий Домашние задания
  • неблокирующий Проект
  • неблокирующий Посещаемость
Промежуточная аттестация

Промежуточная аттестация

  • 2022/2023 учебный год 4 модуль
    0.5 * Домашние задания + 0.2 * Посещаемость + 0.3 * Проект
  • 2023/2024 учебный год 2 модуль
    0.1 * Домашние задания + 0.1 * Домашние задания + 0.25 * Посещаемость + 0.25 * Посещаемость + 0.15 * Проект + 0.15 * Проект
Список литературы

Список литературы

Рекомендуемая основная литература

  • Nelli, F. (2018). Python Data Analytics : With Pandas, NumPy, and Matplotlib (Vol. Second edition). New York, NY: Apress. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=1905344
  • Федоров, Д. Ю.  Программирование на языке высокого уровня Python : учебное пособие для среднего профессионального образования / Д. Ю. Федоров. — 2-е изд. — Москва : Издательство Юрайт, 2019. — 161 с. — (Профессиональное образование). — ISBN 978-5-534-11961-9. — Текст : электронный // Образовательная платформа Юрайт [сайт]. — URL: https://urait.ru/bcode/446505 (дата обращения: 28.08.2023).
  • Шолле Франсуа - Глубокое обучение на Python. — (Серия «Библиотека программиста»). - 978-5-4461-0770-4 - Санкт-Петербург: Питер - 2021 - 376833 - https://ibooks.ru/bookshelf/376833/reading - iBOOKS
  • Шолле Франсуа - Глубокое обучение на Python. 2-е межд. издание. — (Серия «Библиотека программиста») - 978-5-4461-1909-7 - Санкт-Петербург: Питер - 2023 - 386793 - https://ibooks.ru/bookshelf/386793/reading - iBOOKS

Рекомендуемая дополнительная литература

  • Perkins, J. (2014). Python 3 Text Processing with NLTK 3 Cookbook. Birmingham: Packt Publishing. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=836632
  • Python и анализ данных, Маккинли, У., 2015
  • Бхаргава А. - Грокаем алгоритмы. Иллюстрированное пособие для программистов и любопытствующих. — (Серия «Библиотека программиста») - 978-5-4461-0923-4 - Санкт-Петербург: Питер - 2022 - 376971 - https://ibooks.ru/bookshelf/376971/reading - iBOOKS
  • Лучано, Р. Python. К вершинам мастерства / Р. Лучано , перевод с английского А. А. Слинкин. — Москва : ДМК Пресс, 2016. — 768 с. — ISBN 978-5-97060-384-0. — Текст : электронный // Лань : электронно-библиотечная система. — URL: https://e.lanbook.com/book/93273 (дата обращения: 00.00.0000). — Режим доступа: для авториз. пользователей.
  • Митчелл Райан - Современный скрапинг веб-сайтов с помощью Python. 2-е межд. изд. — (Серия «Бестселлеры O'Reilly») - 978-5-4461-1693-5 - Санкт-Петербург: Питер - 2021 - 376969 - https://ibooks.ru/bookshelf/376969/reading - iBOOKS
  • Скрапинг веб - сайтов с помощью Python : сбор данных из современного интернета, Митчелл, Р., 2016

Авторы

  • Федорова Ксения Александровна