Бакалавриат
2021/2022
Технологии анализа данных в Internet
Статус:
Курс по выбору (Бизнес-информатика)
Направление:
38.03.05. Бизнес-информатика
Где читается:
Факультет менеджмента (Пермь)
Когда читается:
4-й курс, 1, 2 модуль
Формат изучения:
с онлайн-курсом
Онлайн-часы:
36
Охват аудитории:
для своего кампуса
Язык:
русский
Кредиты:
6
Контактные часы:
40
Программа дисциплины
Аннотация
Настоящая программа учебной дисциплины устанавливает требования к образовательным результатам и результатам обучения студента и определяет содержание и виды учебных занятий и отчетности. Программа предназначена для преподавателей, ведущих дисциплину «Технологии анализа данных в Internet», учебных ассистентов и студентов направления подготовки 38.03.05 Бизнес-информатика, обучающихся по образовательной программе «Бизнес информатика».
Цель освоения дисциплины
- Развитие у студентов компетенций проектирования и конструирования программного обеспечения с использованием современных языков, технологий и инструментальных средств разработки программного обеспечения
Планируемые результаты обучения
- Студент знает и способен использовать т векторная модель слов для обработки естественного языка
- Студент знает и способен использовать технологии Semantic Web
- Студент знает и способен использовать технологии обработки естественного языка
- Студент имеет представление об основных тенденциях развития интернет-технологий
- Студент способен из извлекать информацию из веб-сайтов
- Студент способен из извлекать информацию из социальных сетей
- Студент способен из извлекать информацию с использованием Web API
- Студент способен использовать информационно-поисковые тезаурусы и онтологии при обработке информации
- Студент способен использовать технологии семантической аннотации при обработке текста
- Студент способен использовать форматы XML и JSON для хранения и обработки данных
- Студент способен применять технологию регулярных выражений для обработки текстов
Содержание учебной дисциплины
- Тема 1. Регулярные выражения
- Тема 2. Обработка данных в формате XML и JSON.
- Тема 3. Скрапинг веб-сайтов
- Тема 4. Работа с Web API
- Тема 5. Извлечение данных из социальных сетей
- Тема 6. Информационно-поисковые тезаурусы и онтологии
- Тема 7. Семантическая аннотация
- Тема 8. Основные понятия обработки ЕЯ
- Тема 9. Библиотеки обработки ЕЯ
- Тема 10. Векторная модель слов
- Тема 11. Основные тенденции развития интернет-технологий
- Тема 12. Технологии Semantic Web
Элементы контроля
- Лабораторная работа 1
- Лабораторная работа 2
- Лабораторная работа 3
- Лабораторная работа 4 (самостоятельная работа)
- ЭкзаменЭкзамен проводится в форме выполнения группового проекта. Проектная группа реализует и представляет на публичную защиту программный продукт, реализующий сбор, обработку или анализ данных. Тематика проекта выбирается группой самостоятельно и согласуется с преподавателем.
- Прохождение online-курсов
- Лабораторная работа №5
Промежуточная аттестация
- 2021/2022 учебный год 2 модуль0.12 * Лабораторная работа 4 (самостоятельная работа) + 0.12 * Лабораторная работа 2 + 0.12 * Лабораторная работа 3 + 0.1 * Прохождение online-курсов + 0.3 * Экзамен + 0.12 * Лабораторная работа №5 + 0.12 * Лабораторная работа 1
Список литературы
Рекомендуемая основная литература
- Федоров Д. Ю. - ПРОГРАММИРОВАНИЕ НА ЯЗЫКЕ ВЫСОКОГО УРОВНЯ PYTHON 2-е изд., пер. и доп. Учебное пособие для прикладного бакалавриата - М.:Издательство Юрайт - 2019 - 161с. - ISBN: 978-5-534-10971-9 - Текст электронный // ЭБС ЮРАЙТ - URL: https://urait.ru/book/programmirovanie-na-yazyke-vysokogo-urovnya-python-437489
Рекомендуемая дополнительная литература
- Сысолетин Е. Г., Ростунцев С. Д. ; под науч. ред. Доросинского Л.Г. - РАЗРАБОТКА ИНТЕРНЕТ-ПРИЛОЖЕНИЙ. Учебное пособие для вузов - М.:Издательство Юрайт - 2019 - 90с. - ISBN: 978-5-9916-9975-4 - Текст электронный // ЭБС ЮРАЙТ - URL: https://urait.ru/book/razrabotka-internet-prilozheniy-438148