Магистратура
2023/2024
Введение в прикладную лингвистику
Лучший по критерию «Полезность курса для Вашей будущей карьеры»
Лучший по критерию «Полезность курса для расширения кругозора и разностороннего развития»
Лучший по критерию «Новизна полученных знаний»
Статус:
Курс обязательный (Языковые технологии в бизнесе и образовании)
Направление:
45.04.03. Фундаментальная и прикладная лингвистика
Кто читает:
Департамент филологии
Где читается:
Санкт-Петербургская школа гуманитарных наук и искусств
Когда читается:
1-й курс, 3, 4 модуль
Формат изучения:
без онлайн-курса
Охват аудитории:
для своего кампуса
Преподаватели:
Колмогорова Анастасия Владимировна
Прогр. обучения:
Языковые технологии в бизнесе и образовании
Язык:
русский
Кредиты:
6
Контактные часы:
44
Программа дисциплины
Аннотация
Целью дисциплины является знакомство студентов с основными компонентами и основными направлениями специальности (машинный перевод, информационный поиск, извлечение информации, диалоговые системы, анализ тональностей, квантитативная лингвистика и др.). В результате освоения дисциплины студенты получат базовое представление об основных направлениях современной прикладной лингвистики.
Цель освоения дисциплины
- Сформировать представления о различных способах работы с данными.
- Ознакомить с методами визуализации результатов анализа датасетов.
- Развить умение писать программы с использованием методов статистического, кластерного и регрессионного анализа.
Планируемые результаты обучения
- Студент создает пуассоновскую регрессию, позволяющую предсказывать результаты показателя X на основе имеющихся данных показателя Y.
- Студент применяет PCA CA, MCA, MDS, t-SNE для анализа различных датасетов и уменьшения размерности данных.
- Студент применяет методы визуализации сетевых данных c помощью пакетов, ggiraph
- Студент применяет трансформации данных: tidyverse, dplyr; освоит работу со строками и текстами: tidytext, udpipe; сможет осуществлять сбор данных из интернета: rvest. OCR.
- Студент производит вычисления, применяя знания по описательной и симуляционной статистике, z-преобразованию, используя пакет анализа RLing
- Студент анализирует данные путём применения инструментов, время, карты, OCR.
- Студент освоит работу с базовыми объектами языка R, функциями, пакетами, а также научится создавать собственные функции и циклы.
- Студент применяет методы визуализации сетевых данных c помощью пакетов ggplot и ggplot2
- Студент решает задачи по программированию, демонстрируя умение анализировать строки тексты и весь текст с помощью пакета ling
- Студент способен создавать метрики расстояний, k-means, иерархические кластеризации, визуализации деревьев.
Содержание учебной дисциплины
- Основы R
- Трансформация данных
- Визуализация и представление данных
- Работа со строками и текстом
- Необычные источники данных: время, карты, OCR
- Основы статистики
- Регрессионный анализ
- Кластеризация
- Методы уменьшения размерности кластеров
- Сетевой анализ
Элементы контроля
- Самостоятельная работаВ течение курса студенты выполняют 7 домашних работ, которые обсуждаются на занятии, после обсуждения могут быть доработаны и представлены для оценивания. В домашней работе студенту предлагается решить локальную исследовательскую задачу, использовав обсуждавшиеся в лекции методы и инструментарий.
- ЭкзаменЭкзамен проводится в устной форме: студент отвечает на один из проблематизирующих вопросов из заранее предоставленного для подготовки списка.
Промежуточная аттестация
- 2023/2024 учебный год 4 модуль0.35 * Самостоятельная работа + 0.35 * Самостоятельная работа + 0.3 * Экзамен
Список литературы
Рекомендуемая основная литература
- Stowell, S. (2014). Using R for Statistics. Berkeley, CA: Apress. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=1174344
Рекомендуемая дополнительная литература
- Toomey, D. (2014). R for Data Science. Birmingham, UK: Packt Publishing. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=933765