• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта
Бакалавриат 2023/2024

Технологии анализа данных в сети интернет

Лучший по критерию «Полезность курса для расширения кругозора и разностороннего развития»
Статус: Курс по выбору (Программная инженерия)
Направление: 09.03.04. Программная инженерия
Где читается: Факультет менеджмента (Пермь)
Когда читается: 4-й курс, 1, 2 модуль
Формат изучения: с онлайн-курсом
Онлайн-часы: 20
Охват аудитории: для всех кампусов НИУ ВШЭ
Язык: русский
Кредиты: 6
Контактные часы: 40

Программа дисциплины

Аннотация

Учебный курс "Технологии анализа данных в сети Интернет" ориентирован на изучение методов и технологий, используемых при сборе и анализе данных в сети Интернет, а также на получение практических навыков разработки программных решений для автоматизации данных задач. В рамках курса изучаются подходы к извлечению данных из неструктурированных источников (корпуса текстов, web-страницы, социальные сети), вопросы обработки мультимедийной информации и естественного языка, тенденции развития Web-технологий.
Цель освоения дисциплины

Цель освоения дисциплины

  • Развитие у студентов компетенций проектирования и конструирования программного обеспечения с использованием современных языков, технологий и инструментальных средств разработки программного обеспечения
Планируемые результаты обучения

Планируемые результаты обучения

  • Студент знает и способен использовать т векторная модель слов для обработки естественного языка
  • Студент знает и способен использовать технологии Semantic Web
  • Студент знает и способен использовать технологии обработки естественного языка
  • Студент имеет представление об основных тенденциях развития интернет-технологий
  • Студент способен из извлекать информацию из веб-сайтов
  • Студент способен из извлекать информацию из социальных сетей
  • Студент способен из извлекать информацию с использованием Web API
  • Студент способен использовать информационно-поисковые тезаурусы и онтологии при обработке информации
  • Студент способен использовать технологии семантической аннотации при обработке текста
  • Студент способен использовать форматы XML и JSON для хранения и обработки данных
  • Студент способен применять технологию регулярных выражений для обработки текстов
Содержание учебной дисциплины

Содержание учебной дисциплины

  • Тема 1. Регулярные выражения
  • Тема 2. Обработка данных в формате XML и JSON.
  • Тема 3. Скрапинг веб-сайтов
  • Тема 4. Работа с Web API
  • Тема 5. Извлечение данных из социальных сетей
  • Тема 6. Информационно-поисковые тезаурусы и онтологии
  • Тема 7. Семантическая аннотация
  • Тема 8. Основные понятия обработки ЕЯ
  • Тема 9. Библиотеки обработки ЕЯ
  • Тема 10. Векторная модель слов
  • Тема 11. Основные тенденции развития интернет-технологий
  • Тема 12. Технологии Semantic Web
Элементы контроля

Элементы контроля

  • неблокирующий Лабораторная работа 1
  • неблокирующий Лабораторная работа 2
  • неблокирующий Лабораторная работа 3
  • неблокирующий Лабораторная работа 4
  • неблокирующий Итоговый проект
  • неблокирующий Онлайн-курс
Промежуточная аттестация

Промежуточная аттестация

  • 2023/2024 учебный год 2 модуль
    0.3 * Итоговый проект + 0.15 * Лабораторная работа 1 + 0.15 * Лабораторная работа 2 + 0.15 * Лабораторная работа 3 + 0.15 * Лабораторная работа 4 + 0.1 * Онлайн-курс
Список литературы

Список литературы

Рекомендуемая основная литература

  • Федоров, Д. Ю.  Программирование на языке высокого уровня Python : учебное пособие для прикладного бакалавриата / Д. Ю. Федоров. — 2-е изд., перераб. и доп. — Москва : Издательство Юрайт, 2019. — 161 с. — (Бакалавр. Прикладной курс). — ISBN 978-5-534-10971-9. — Текст : электронный // Образовательная платформа Юрайт [сайт]. — URL: https://urait.ru/bcode/437489 (дата обращения: 28.08.2023).

Рекомендуемая дополнительная литература

  • Антамошкин, О. А. Программная инженерия. Теория и практика [Электронный ресурс] : учебник / О. А. Антамошкин. - Красноярск: Сиб. Федер. ун-т, 2012. - 247 с. - ISBN 978-5-7638-2511-4.
  • Сысолетин, Е. Г.  Разработка интернет-приложений : учебное пособие для вузов / Е. Г. Сысолетин, С. Д. Ростунцев ; под научной редакцией Л. Г. Доросинского. — Москва : Издательство Юрайт, 2019 ; Екатеринбург : Изд-во Урал. ун-та. — 90 с. — (Университеты России). — ISBN 978-5-9916-9975-4 (Издательство Юрайт). — ISBN 978-5-7996-1911-4 (Изд-во Урал. ун-та). — Текст : электронный // Образовательная платформа Юрайт [сайт]. — URL: https://urait.ru/bcode/438148 (дата обращения: 28.08.2023).

Авторы

  • Карпович Марина Валерьевна
  • Ланин Вячеслав Владимирович