• A
  • A
  • A
  • ABC
  • ABC
  • ABC
  • А
  • А
  • А
  • А
  • А
Regular version of the site

Natural Language Processing

2024/2025
Academic Year
RUS
Instruction in Russian
3
ECTS credits
Course type:
Elective course
When:
3 year, 1 module

Instructor


Orlov, Alexander

Программа дисциплины

Аннотация

Целями освоения дисциплины «Автоматическая обработка естественного языка» являются овладение студентами основными методами автоматической обработки текста на разных уровнях лингвистического анализа. Изучение дисциплины «Автоматическая обработка естественного языка» базируется на следующих дисциплинах: курс по теории языка программы подготовки бакалавра курс по дискретной математики программы подготовки бакалавра начальный курс по программированию программы подготовки бакалавра английский язык Для освоения учебной дисциплины студенты должны владеть следующими знания-ми и компетенциями: владеть базовыми представлениями о грамматических категориях и анализе языковых единиц; владеть базовыми знаниями в области теории алгоритмов и основ математики; владеть базовыми знаниями в области теории вероятностей и статистики; уметь читать научные работы и технические описания на английском языке; владеть базовыми навыками программирования на языке Python.
Цель освоения дисциплины

Цель освоения дисциплины

  • В результате освоения дисциплины студент должен: знать:  основные задачи компьютерной лингвистики;  основные формальные модели, лежащие в основе различных модулей автоматической обработки текста;  необходимые этапы морфологического анализа и проблемы, возникающие при моделировании каждого из этапов;  основные алгоритмы, используемые для построения автоматического синтаксического анализа;  наиболее известные доступные для свободного использования компоненты автоматического анализа, в том числе синтаксические и морфологические парсеры;  принципы оценки качества таких систем; уметь:  создавать модули первичной обработки текста;  строить формальную модель морфологии для создания системы автоматического морфологического анализа;  проводить оценку качества систем автоматического морфологического, синтаксического и семантического анализа;  использовать соответствующие модули в различных приложениях; владеть:  разработки программ первичной обработки текста;  использования систем автоматического морфологического анализа;  тестирования систем морфологического и синтаксического анализа. Основные положения дисциплины должны быть использованы в дальнейшем при изучении следующих дисциплин:  автоматическая обработка естественного языка: семантика, анализ контента; а также в исследованиях при написании курсовых работ.
Планируемые результаты обучения

Планируемые результаты обучения

  • запускает синтаксический анализатор
  • знает основные задачи АОТ
  • осуществляет морфологическую аннотацию текста, определяет качество морфологического таггера; например, строит конечный автомат для анализа одного из морфонологических явлений в одном из малоресурсных языках
  • осуществляет первичную обработку текста, разбиение на предложения, распознавание языка
Содержание учебной дисциплины

Содержание учебной дисциплины

  • Введение в компьютерную лингвистику
  • Первичная обработка текста. Модель информационного поиска. Векторизация текста
  • Автоматический морфологический анализ
  • Автоматический синтаксический анализ
  • Проект по АОЕЯ
Элементы контроля

Элементы контроля

  • неблокирующий Квиз
  • неблокирующий Проект
  • неблокирующий Домашние задания
  • неблокирующий проект
  • неблокирующий домашние задания
  • неблокирующий квиз
Промежуточная аттестация

Промежуточная аттестация

  • 2024/2025 1st module
    0.4 * Домашние задания + 0.25 * Квиз + 0.35 * Проект
  • 2025/2026 1st module
    0.4 * домашние задания + 0.25 * квиз + 0.35 * проект
Список литературы

Список литературы

Рекомендуемая основная литература

  • Manning, C. D., & Schèutze, H. (1999). Foundations of Statistical Natural Language Processing. Cambridge, Mass: The MIT Press. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=24399
  • Speech and language processing, Jurafsky, D., 2014
  • Федоров, Д. Ю.  Программирование на языке высокого уровня Python : учебное пособие для среднего профессионального образования / Д. Ю. Федоров. — 2-е изд. — Москва : Издательство Юрайт, 2019. — 161 с. — (Профессиональное образование). — ISBN 978-5-534-11961-9. — Текст : электронный // Образовательная платформа Юрайт [сайт]. — URL: https://urait.ru/bcode/446505 (дата обращения: 28.08.2023).

Рекомендуемая дополнительная литература

  • Мандель, Б. Р. Современный русский язык: лексика, словообразование, морфология [Электронный ресурс] : Учеб. пособие / Б. Р. Мандель. - М.: Вузовский учебник: ИНФРА-М, 2013. - 374 с. - ISBN 978-5-9558-0300-5 (Вузовский учебник), 978-5-16-006528-1 (ИНФРА-М). - Режим доступа: http://znanium.com/catalog/product/403676

Авторы

  • Орлов Александр Викторович