Бакалавриат
2020/2021




Математика и Python для анализа данных
Статус:
Курс по выбору (Филология)
Направление:
45.03.01. Филология
Кто читает:
Департамент филологии
Где читается:
Санкт-Петербургская школа гуманитарных наук и искусств
Когда читается:
2-й курс, 4 модуль
Формат изучения:
с онлайн-курсом
Преподаватели:
Климов Александр Антонович
Язык:
русский
Кредиты:
4
Контактные часы:
2
Программа дисциплины
Аннотация
Для успешного применения методов анализа данных нужно уметь программировать. Фактическим стандартом для этого в наши дни является язык Python. В данном курсе мы предлагаем познакомиться с его синтаксисом, а также научиться работать с его основными библиотеками, полезными для анализа данных, например, NumPy, SciPy, Matplotlib и Pandas.
Цель освоения дисциплины
- Ознакомление студентов с основами работы с языком Python в анализе данных. Расширение теоретической и практической подготовки студента в области математического анализа, линейной алгебры, методов оптимизации, теории вероятностей.
Планируемые результаты обучения
- Студент понимает особенности языка Python для анализа данных. Знает, что такое Циклы, функции, генераторы, list comprehension. понимает, как происходит чтение различных данных.
- Студент ориентируется в Python-библиотеках, содержащих большое количество полезных инструментов: от быстрых операций с многомерными массивами до визуализации и реализации различных математических методов. Владеет основами линейной алгебры — основного математического аппарата для работы с данными.
- Студент способен с помощью методов оптимизации находить наилучшие значения параметров системы, чтобы минимизировать затраты или максимизировать точность предсказаний, а также имеет представление о с матричными разложениями, которые используются при построении регрессионных моделей, для уменьшения размерности данных, в рекомендательных системах и в анализе текстов.
- Студент освоил базовые концепции теории вероятностей и статистики, которые необходимы для понимания механизма работы практически всех методов анализа данных. Имеет представление о самых популярных распределениях, знает, какие явления ими описываются и какими статистиками оцениваются их параметры.
Содержание учебной дисциплины
- ВведениеPython — один из главных инструментов специалиста в науке о данных. Циклы, функции, генераторы, list comprehension. Функции и их свойства. Предел и производная. Геометрический смысл производной.
- Библиотеки Python и линейная алгебраPandas. Data Frame. NumPy, SciPy и Matplotlib. Решение оптимизационных задач в SciPy. Системы линейных уравнений. Матричные операции. Ранг и определитель
- Оптимизация и матричные разложенияЧастные производные и градиент. Касательная плоскость и линейное приближение. Оптимизация негладких функций. Метод имитации отжига. Генетические алгоритмы и дифференциальная эволюция. Нелдер-Мид. Приближение матрицей меньшего ранга.
- СлучайностьСлучайность в теории вероятностей и статистике.Свойства вероятности. Условная вероятность. Оценка распределения по выборке. Важные характеристики распределений. Центральная предельная теорема. Доверительные интервалы.
Промежуточная аттестация
- Промежуточная аттестация (4 модуль)0.4 * Домашняя работа + 0.6 * Контрольная работа
Список литературы
Рекомендуемая основная литература
- Müller, A. C., & Guido, S. (2017). Introduction to Machine Learning with Python : A Guide for Data Scientists: Vol. First edition. Reilly - O’Reilly Media.
- Бурмистрова Е. Б., Лобанов С. Г. - ЛИНЕЙНАЯ АЛГЕБРА. Учебник и практикум для академического бакалавриата - М.:Издательство Юрайт - 2019 - 421с. - ISBN: 978-5-9916-3588-2 - Текст электронный // ЭБС ЮРАЙТ - URL: https://urait.ru/book/lineynaya-algebra-425852
Рекомендуемая дополнительная литература
- Потапов А. П. - ЛИНЕЙНАЯ АЛГЕБРА И АНАЛИТИЧЕСКАЯ ГЕОМЕТРИЯ. Учебник и практикум для СПО - М.:Издательство Юрайт - 2019 - 310с. - ISBN: 978-5-534-01061-9 - Текст электронный // ЭБС ЮРАЙТ - URL: https://urait.ru/book/lineynaya-algebra-i-analiticheskaya-geometriya-437430