Магистратура
2021/2022
Введение в Науку о данных
Лучший по критерию «Новизна полученных знаний»
Статус:
Курс обязательный (Цифровые методы в гуманитарных науках)
Направление:
46.04.01. История
Кто читает:
Кафедра гуманитарных дисциплин (Пермь)
Где читается:
Факультет экономики (Пермь)
Когда читается:
1-й курс, 1-3 модуль
Формат изучения:
без онлайн-курса
Охват аудитории:
для своего кампуса
Преподаватели:
Бузмаков Алексей Владимирович
Прогр. обучения:
Цифровые методы в гуманитарных науках
Язык:
русский
Кредиты:
7
Контактные часы:
86
Программа дисциплины
Аннотация
Дисциплина представляет собой вводный курс в Data Science. Он включает в себя изучение необходимых для дальнейшей работы основ математики, прежде всего математической статистики, овладение необходимым инструментарием SPSS и Python; основных задач анализа данных и машинного обучения (регрессия, классификация, кластеризация), методы анализа текстовых данных.
Цель освоения дисциплины
- Цель дисциплины «Введение в науку о данных» – формирование теоретических и практических компетенций в следующих областях: математическая статистика и методы количественного анализа данных; технологии анализа данных, связанные с манипуляцией большими объемами данных (сбор, очистка, подбор подходящей структуры для формального представления) и методами их визуализации; прикладные навыки в области машинного обучения.
Планируемые результаты обучения
- Демонстрирует навыки визуализации данных.
- Знает основные понятия матема-тической статистики, использует программные средства для ста-тистического анализа.
- Умеет применить основные методы машинного обучения для решения задач предметной области, может сделать выводы по результатам проделанной работы.
Содержание учебной дисциплины
- Раздел 1. Основы математики
- Раздел 2. Методы визуализации данных: диаграммы рассеяния, визуализация погрешностей, гистограммы.
- Раздел 3. Основные задачи и методы машинного обучения.
Элементы контроля
- Проект в рамках 2 и 3 разделаПисьменный отчёт с постановкой задачи, её решение методами, обсуждаемыми на курсе, и выводы о полученных результатах.
- ЭкзаменЭкзамен по дисциплине пройдет онлайн (в zoom) в период сессии 3-го модуля.
- Работа на аудиторных занятиях в рамках первого раздела
Промежуточная аттестация
- 2021/2022 учебный год 3 модуль0.4 * Экзамен + 0.4 * Проект в рамках 2 и 3 раздела + 0.2 * Работа на аудиторных занятиях в рамках первого раздела
Список литературы
Рекомендуемая основная литература
- Иванов Б.Н. - Теория вероятностей и математическая статистика: учебное пособие - Издательство "Лань" - 2019 - ISBN: 978-5-8114-3636-1 - Текст электронный // ЭБС ЛАНЬ - URL: https://e.lanbook.com/book/113901
Рекомендуемая дополнительная литература
- Дюк, В. А. Логический анализ данных : учебное пособие / В. А. Дюк. — Санкт-Петербург : Лань, 2020. — 80 с. — ISBN 978-5-8114-4180-8. — Текст : электронный // Лань : электронно-библиотечная система. — URL: https://e.lanbook.com/book/126935 (дата обращения: 00.00.0000). — Режим доступа: для авториз. пользователей.
- Салин В.Н., Шпаковская Е.П., Вахрамеева М.В. - Социально-экономическая статистика: Практикум: учебное пособие - Издательство "Финансы и статистика" - 2016 - 192с. - ISBN: 978-5-279-02637-1 - Текст электронный // ЭБС ЛАНЬ - URL: https://e.lanbook.com/book/91210
- Юре, Л. Анализ больших наборов данных / Л. Юре, Р. Ананд, Д. У. Джеффри ; перевод с английского А. А. Слинкин. — Москва : ДМК Пресс, 2016. — 498 с. — ISBN 978-5-97060-190-7. — Текст : электронный // Лань : электронно-библиотечная система. — URL: https://e.lanbook.com/book/93571 (дата обращения: 00.00.0000). — Режим доступа: для авториз. пользователей.