• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта
Бакалавриат 2021/2022

Интеллектуальная обработка данных

Направление: 09.03.01. Информатика и вычислительная техника
Когда читается: 3-й курс, 3, 4 модуль
Формат изучения: без онлайн-курса
Охват аудитории: для своего кампуса
Язык: русский
Кредиты: 5
Контактные часы: 82

Программа дисциплины

Аннотация

В рамках данной дисциплины даются такие разделы как машинное обучение (классификация и кластеризация данных, полносвязанные и глубинные нейронные сети), методы визуализации данных, методы обработки текстов, методы обработки изображений. Материал изучается с применением языка программирования Python и написанных для него библиотек. В процессе освоения дисциплины «Интеллектуальная обработка данных» студент развивает следующие компетенции: • способен разрабатывать и применять специализированное программно-математическое обеспечение для проведения исследований и решения инженерных задач; • способен разрабатывать модели средств, систем и процессов в инфокоммуникациях, проверять их адекватность на практике и использовать пакеты прикладных программ анализа и синтеза инфокоммуникационных систем, сетей и устройств; • Способен самостоятельно выполнять экспериментальные исследования для решения научно-исследовательских и производственных задач с использованием современной аппаратуры и методов исследования, участвовать в научных исследованиях в группе, ставить задачи и выбирать методы экспериментальных исследований.
Цель освоения дисциплины

Цель освоения дисциплины

  • Углубить и закрепить навыки в области машинного обучения, формирование знаний и навыков работы с нейронными сетями.
Планируемые результаты обучения

Планируемые результаты обучения

  • Владеть: библиотеками обработки изображений на языке Python.
  • Владеть: навыками применения библиотеки Pandas при решении практических задач.
  • Владеть: навыками разработки методов отображения данных.
  • Владеть: нейросетевым пакетом в составе библиотеки sklearn и других библиотек.
  • Владеть: нейросетевым пакетом в составе библиотеки sklearn.
  • Владеть: программными библиотеками для обработки текстов.
  • Владеть: программными библиотеками классификации, входящими в состав библиотеки sklearn.
  • Владеть: программными библиотеками кластеризации, входящими в состав библиотеки sklearn.
  • Знать: методы обработки, нормализации и векторизации исходных данных, методы агрегирования и анализа данных.
  • Знать: основные методы классификации данных такие как линейная и логистическая регрессия, метод поддерживающих векторов, метод к ближайших соседей, деревья принятия решений, случайный лес; методы оценки качества классификации.
  • Знать: основные методы кластеризации данных: к-средних, DB-SCAN и ипроизводные от них.
  • Знать: основные методы отображения числовой информации; методами снижения размерности пространства признаков.
  • Знать: основные структуры глубинных нейронных сетей: сверточные, рекуррентные, их разновидности.
  • Знать: основные структуры нейронных сетей; понятия функции потерь, пороговой функции, их основные виды.
  • Знать: основные форматы изображений; методы обработки изображений.
  • Знать: понятия лексического, синтаксического и семантического анализа текстов.
  • Уметь: выделять фрагменты изображений в зависимости от поставленной задачи; преобразовывать изображения в зависимости от поставленной задачи.
  • Уметь: использовать библиотеки Matplotlib и Seaborn для отображения информации в ходе проведения исследований.
  • Уметь: корректно формировать структуру нейронной сети для решения поставленной прикладной задачи.
  • Уметь: обоснованно и корректно выбирать метод для решения задачи классификации; корректно ставить задачу классификации.
  • Уметь: обоснованно и корректно выбирать метод для решения задачи кластеризации; корректно ставить задачу кластеризации.
  • Уметь: осуществлять первичный анализ данных для решения прикладных задач.
  • Уметь: реализовать систему анализа текстов на естественном языке.
Содержание учебной дисциплины

Содержание учебной дисциплины

  • Обработка данных с использованием библиотеки Pandas
  • Визуализация данных и их анализ
  • Классификация данных
  • Кластеризация данных
  • Обработка текстов на естественном языке
  • Обработка изображений
  • «Плотные» нейронные сети
  • Глубинное обучение нейронных сетей
Элементы контроля

Элементы контроля

  • неблокирующий Практические занятия
  • неблокирующий Экзамен
    Экзамен проводится в устной форме на платформе Zoom с использованием асинхронного прокторинга (https://hse.student.examus.net). Экзамены проводятся в конце первого и второго модуля в периоды сессий. В билеты включаются вопросы теоретического и прикладного характера по материалам модуля. В билете 2 вопроса. На подготовку к ответу даётся 30 минут и 1,5 часа на написание программы. По желанию студента возможен досрочный ответ. Во время подготовки к ответу допускается использование необходимых справочных материалов и источников, в т.ч. в электронных. Во время устного ответа преподавателю использование вспомогательных материалов не допускается, за исключением кратких поясняющих иллюстраций, схем, диаграмм и т.д. Преподаватель вправе освободить от сдачи экзамена студентов. Особо отличившихся при изучении Дисциплины и набравших накопленную оценку по Дисциплине выше 7 баллов, с выставлением им оценки «отлично» (8, 9, 10 баллов), преподаватель может выставить автоматы. Преподаватель объявляет список таких студентов не позднее, чем за два дня до экзамена. Для объявления оценок могут быть использованы электронные каналы передачи информации, регулярно используемые в процессе обучения.
  • неблокирующий Проект
    проект прикладного характера, связанный с разработкой прототипа решения в области Интернета вещей, представляющего собой систему обработки данных или принятия решений (задание выполняется в часы, отводимые на самостоятельную работу, с возможностью получения консультаций преподавателя в очном или дистанционном формате), преподавателем осуществляется контроль промежуточных и итоговых результатов выполнения задания;
  • неблокирующий Практические занятия
  • неблокирующий Экзамен
    Экзамен проводится в устной форме на платформе Zoom с использованием асинхронного прокторинга (https://hse.student.examus.net). Экзамены проводятся в конце первого и второго модуля в периоды сессий. В билеты включаются вопросы теоретического и прикладного характера по материалам модуля. В билете 2 вопроса. На подготовку к ответу даётся 30 минут и 1,5 часа на написание программы. По желанию студента возможен досрочный ответ. Во время подготовки к ответу допускается использование необходимых справочных материалов и источников, в т.ч. в электронных. Во время устного ответа преподавателю использование вспомогательных материалов не допускается, за исключением кратких поясняющих иллюстраций, схем, диаграмм и т.д. Преподаватель вправе освободить от сдачи экзамена студентов. Особо отличившихся при изучении Дисциплины и набравших накопленную оценку по Дисциплине выше 7 баллов, с выставлением им оценки «отлично» (8, 9, 10 баллов), преподаватель может выставить автоматы. Преподаватель объявляет список таких студентов не позднее, чем за два дня до экзамена. Для объявления оценок могут быть использованы электронные каналы передачи информации, регулярно используемые в процессе обучения.
  • неблокирующий Проект
    проект прикладного характера, связанный с разработкой прототипа решения в области Интернета вещей, представляющего собой систему обработки данных или принятия решений (задание выполняется в часы, отводимые на самостоятельную работу, с возможностью получения консультаций преподавателя в очном или дистанционном формате), преподавателем осуществляется контроль промежуточных и итоговых результатов выполнения задания;
Промежуточная аттестация

Промежуточная аттестация

  • 2021/2022 учебный год 4 модуль
    0.4 * Проект + 0.2 * Экзамен + 0.4 * Практические занятия
Список литературы

Список литературы

Рекомендуемая основная литература

  • Gries, P., Campbell, J., & Montojo, J. (2017). Practical Programming : An Introduction to Computer Science Using Python 3.6 (Vol. Third edition). [Place of publication not identified]: Pragmatic Bookshelf. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=1716748

Рекомендуемая дополнительная литература

  • Bhasin, H. (2019). Python Basics : A Self-Teaching Introduction. Dulles, Virginia: Mercury Learning & Information. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=1991381
  • Matthes, E. Python crash course: a hands-on, project-based introduction to programming. – No Starch Press, 2015. – 562 pp.
  • McKinney, W. (2018). Python for Data Analysis : Data Wrangling with Pandas, NumPy, and IPython (Vol. Second edition). Sebastopol, CA: O’Reilly Media. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=1605925
  • Джозеф, Л. Изучение робототехники с помощью Python / Л. Джозеф ; перевод с английского А. В. Корягина. — Москва : ДМК Пресс, 2019. — 250 с. — ISBN 978-5-97060-749-7. — Текст : электронный // Лань : электронно-библиотечная система. — URL: https://e.lanbook.com/book/123716 (дата обращения: 00.00.0000). — Режим доступа: для авториз. пользователей.

Авторы

  • Клышинский Эдуард Станиславович
  • Востриков Александр Владимирович