Бакалавриат
2021/2022
Компьютерная лингвистика
Статус:
Курс по выбору (Филология)
Направление:
45.03.01. Филология
Кто читает:
Департамент филологии
Где читается:
Санкт-Петербургская школа гуманитарных наук и искусств
Когда читается:
4-й курс, 1, 2 модуль
Формат изучения:
без онлайн-курса
Охват аудитории:
для своего кампуса
Язык:
русский
Кредиты:
3
Контактные часы:
42
Программа дисциплины
Аннотация
Курс предполагает знакомство студентов с основными направлениями и методами компьютерной лингвистики, формированию у них практических навыков работы с лингвистическими ресурсами и программами компьютерного анализа текстов, построение собственного корпуса текстов или лингвистической базы данных и проведение лингвистического исследования с использованием компьютерных средств. Курс предназначен для студентов-филологов и не требует специальной компьютерной подготовки или навыков программирования. Предлагаемый курс будет полезен не только студентам лингвистического направления, но и студентам-литературоведам, поскольку синтез традиционного и компьютерного подхода в филологических исследованиях является весьма перспективным.
Цель освоения дисциплины
- Получение студентами знания об основных методах и направлениях развития компьютерной лингвистики.
- Приобретение студентами навыков адекватного пользование основными программными продуктами, необходимыми при работе с текстами и корпусами текстов, и навыков создания собственных корпусов текстов для решения локальных научных и академических задач.
Планируемые результаты обучения
- Студент знает базовые принципы работы с мультимедийным контентом
- Студент знает программы по автоматической обработке текстов на лексическом и морфологическом уровнях и умеет ими пользоваться
- Студент знает программы по автоматической обработке текстов на синтаксическом, семантическом и прагматическом уровнях и умеет ими пользоваться.
- Студент знаком с основами статистического анализа, методами и подходами квантитативной лингвистики
- Студент имеет представление об основных задачах и приложениях компьютерной лингвистики.
Содержание учебной дисциплины
- Основные задачи, основания и приложения компьютерной лингвистики
- Возможности и программы автоматической обработки текстов на лексическом и морфологическом уровнях
- Возможности и программы автоматической обработки текстов на синтаксическом, семантическом и прагматическом уровнях
- Возможности аннотирования и автоматического анализа мультимедийного контента (аудио- и видеозаписей)
- Основы статистики. Элементы квантитативной лингвистики
Элементы контроля
- ПрезентацияПрезентация не должна занимать более 7-10 минут и должна быть основана на собственных наблюдениях студента в рамках темы семинара. В конце презентации студент должен сформулировать один или два вопроса для дальнейшего обсуждения, обращенные к слушателям. По своему усмотрению студент может сопровождать устную презентацию слайдами PowerPoint или раздаточным материалом. Презентация, текст которой полностью заимствован из печатного или Интернет-источника и никак критически не переработан студентом, оценивается в 0 баллов.
- Практическая работа №1Постройте частотные словари для двух предложенных текстов. Сопоставьте состав и относительные частоты 25 наиболее употребительных слов.
- Домашнее заданиеВыполняется письменно, не разбивается на варианты и состоит из небольших упражнений, проверяющих усвоение материала лекций и семинаров. Направляется студентам по электронной почте в течение модуля. Студенты направляют ответ преподавателю также по электронной почте. Преподаватель дает обратную связь студентам на следующем семинаре, разбирая основные ошибки.
- Практическая работа №2Выполните автоматический синтаксический парсинг заданных текстов с помощью разных утилит синтаксического анализа. Сопоставьте полученные результаты. Выполните с применением автоматических методов сравнение двух текстов с точки зрения используемых в них лексических средств.
- Контрольная работаВыполняется письменно в аудитории без вариантов. Задания для контрольной работы разработаны на основе пройденного материала.. Во время написания работы разрешается пользоваться только указанными в варианте источниками.
Промежуточная аттестация
- 2021/2022 учебный год 2 модуль0.2 * Домашнее задание + 0.3 * Контрольная работа + 0.2 * Практическая работа №1 + 0.1 * Презентация + 0.2 * Практическая работа №2
Список литературы
Рекомендуемая основная литература
- Davies, A., & Elder, C. (2004). The Handbook of Applied Linguistics. Malden, MA: Wiley-Blackwell. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=108713
- Lappin, S., Fox, C., & Clark, A. (2010). The Handbook of Computational Linguistics and Natural Language Processing. Chichester, West Sussex: Wiley-Blackwell. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=330500
Рекомендуемая дополнительная литература
- Baker, P., Hardie, A., & McEnery, T. (2006). A Glossary of Corpus Linguistics. Edinburgh: Edinburgh University Press. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=169612