Магистратура
2020/2021
Введение в Науку о данных
Лучший по критерию «Новизна полученных знаний»
Статус:
Курс обязательный (Цифровые методы в гуманитарных науках)
Направление:
46.04.01. История
Кто читает:
Кафедра гуманитарных дисциплин (Пермь)
Где читается:
Социально-гуманитарный факультет (Пермь)
Когда читается:
1-й курс, 1-3 модуль
Формат изучения:
без онлайн-курса
Преподаватели:
Бузмаков Алексей Владимирович,
Гагарина Динара Амировна,
Сенина Анна Васильевна,
Чунарева Светлана Федоровна
Прогр. обучения:
Цифровые методы в гуманитарных науках
Язык:
русский
Кредиты:
8
Контактные часы:
86
Программа дисциплины
Аннотация
Дисциплина представляет собой вводный курс в Data Science. Он включает в себя изучение необходимых для дальнейшей работы основ математики, прежде всего математической статистики, овладение необходимым инструментарием SPSS и Python; основных задач анализа данных и машинного обучения (регрессия, классификация, кластеризация), методы анализа текстовых данных.
Цель освоения дисциплины
- Цель дисциплины «Введение в науку о данных» – формирование теоретических и практических компетенций в следующих областях: математическая статистика и методы количественного анализа данных; технологии анализа данных, связанные с манипуляцией большими объемами данных (сбор, очистка, подбор подходящей структуры для формального представления) и методами их визуализации; прикладные навыки в области машинного обучения.
Планируемые результаты обучения
- Знает основные понятия матема-тической статистики, использует программные средства для ста-тистического анализа.
- Демонстрирует навыки визуализации данных.
- Умеет применить основные методы машинного обучения для решения задач предметной области, может сделать выводы по результатам проделанной работы.
Содержание учебной дисциплины
- Раздел 1. Основы математикиЭлементы математического анализа, множества, функции, графики функции, аппроксимация, дифференциальное исчисление. Элементы линейной алгебры, понятие вектора, матрицы, метрики. Основы теории вероятностей и математической статистики. Базовые понятия статистики (выборка, распределение, среднее, мода и медиана, доверительные интервалы, дисперсия и среднеквадратическое отклонение). Методы проверки гипотез. Сбор и подготовка данных для анализа. Работа с Excel, SPSS, Python.
- Раздел 2. Методы визуализации данных: диаграммы рассеяния, визуализация погрешностей, гистограммы.Методы визуализации малоразмерных данных. Методы анализа многомерных данных (метод главных компонент и многомерное шкалирование).
- Раздел 3. Основные задачи и методы машинного обучения.Классические задачи машинного обучения: регрессия, классификация, кластеризация. Основы глубинного обучения для анализа текстовых данных.
Элементы контроля
- Проект в рамках 2 и 3 разделаПисьменный отчёт с постановкой задачи, её решение методами, обсуждаемыми на курсе, и выводы о полученных результатах.
- ЭкзаменЭкзамен по дисциплине пройдет онлайн (в zoom) в период сессии 3-го модуля.
- Работа на аудиторных занятиях в рамках первого раздела
Промежуточная аттестация
- Промежуточная аттестация (3 модуль)0.4 * Проект в рамках 2 и 3 раздела + 0.2 * Работа на аудиторных занятиях в рамках первого раздела + 0.4 * Экзамен
Список литературы
Рекомендуемая основная литература
- Иванов Б.Н. - Теория вероятностей и математическая статистика: учебное пособие - Издательство "Лань" - 2019 - 224с. - ISBN: 978-5-8114-3636-1 - Текст электронный // ЭБС ЛАНЬ - URL: https://e.lanbook.com/book/113901
Рекомендуемая дополнительная литература
- Дюк В.А. - Логический анализ данных: учебное пособие - Издательство "Лань" - 2020 - 80с. - ISBN: 978-5-8114-4180-8 - Текст электронный // ЭБС ЛАНЬ - URL: https://e.lanbook.com/book/126935
- Салин В.Н., Шпаковская Е.П., Вахрамеева М.В. - Социально-экономическая статистика: Практикум: учебное пособие - Издательство "Финансы и статистика" - 2016 - 192с. - ISBN: 978-5-279-02637-1 - Текст электронный // ЭБС ЛАНЬ - URL: https://e.lanbook.com/book/91210
- Юре Лесковец, Ананд Раджараман, Джеффри Д. Ульма - Анализ больших наборов данных - Издательство "ДМК Пресс" - 2016 - 498с. - ISBN: 978-5-97060-190-7 - Текст электронный // ЭБС ЛАНЬ - URL: https://e.lanbook.com/book/93571