We use cookies in order to improve the quality and usability of the HSE website. More information about the use of cookies is available here, and the regulations on processing personal data can be found here. By continuing to use the site, you hereby confirm that you have been informed of the use of cookies by the HSE website and agree with our rules for processing personal data. You may disable cookies in your browser settings.

  • A
  • A
  • A
  • ABC
  • ABC
  • ABC
  • А
  • А
  • А
  • А
  • А
Regular version of the site

Analysis of Biological Data using Neural Networks

2024/2025
Academic Year
RUS
Instruction in Russian
6
ECTS credits
Course type:
Compulsory course
When:
1 year, 3, 4 module

Программа дисциплины

Аннотация

Курс посвящен анализу и интерпретации биологических данных с использованием современных методов машинного обучения, включая нейронные сети. Основная цель курса – ознакомить студентов с различными типами биологических данных, такими как геномные, протеомные, и электрофизиологические, и научить их применять методы глубокого обучения для решения задач, связанных с анализом этих данных. Программа курса охватывает полный цикл анализа данных: от предобработки и статистического анализа данных до выбора и настройки архитектур нейронных сетей, таких как сверточные (CNN) и рекуррентные (RNN) сети. В курсе также рассматриваются продвинутые методы, включая автоэнкодеры для выделения признаков и трансферное обучение для адаптации предобученных моделей на малых наборах данных. Особое внимание уделяется интерпретации и объяснению моделей, что важно для применения нейронных сетей в биологических и медицинских исследованиях. Практическая часть курса включает семинары, на которых студенты получат опыт работы с реальными биологическими наборами данных. Итоговый проект позволит студентам применить полученные знания для решения конкретной биологической задачи и продемонстрировать свои навыки в области анализа данных и построения моделей нейронных сетей.
Цель освоения дисциплины

Цель освоения дисциплины

  • Овладеть основными методами анализа биологических данных и научиться применять их для решения задач в биоинформатике и нейробиологии.
  • Изучить принципы работы и настройки нейронных сетей, включая сверточные и рекуррентные архитектуры, а также методы их адаптации для анализа биологических данных.
  • Развить навыки предобработки данных, включая очистку, нормализацию, аугментацию, а также базовые навыки статистического анализа для корректного анализа биологических данных.
  • Научиться использовать методы интерпретации и объяснимости нейронных сетей, чтобы повысить доверие к результатам моделей при анализе медицинских и биологических данных.
  • Получить практический опыт работы с реальными биологическими наборами данных и углубить понимание возможностей и ограничений нейронных сетей в биологических исследованиях.
  • Подготовить студентов к самостоятельной работе в междисциплинарных проектах, связанных с анализом биологических данных и машинным обучением, включая разработку и реализацию собственных моделей.
Планируемые результаты обучения

Планируемые результаты обучения

  • Знает основные типы биологических данных
  • Знает основные архитектуры нейронных сетей (сверточные, рекуррентные, автоэнкодеры, трансформеры) и умеет выбирать их для анализа различных типов биологических данных.
  • Знает методы предобработки данных, такие как очистка, нормализация, аугментация, и умеет применять их для подготовки биологических данных.
  • Умеет использовать методы статистического анализа для проверки гипотез и обнаружения паттернов в биологических данных.
  • Умеет строить и обучать нейронные сети для решения задач классификации, регрессии и анализа временных рядов на биологических данных.
  • Умеет применять методы объяснимости (SHAP, LIME) для анализа влияния признаков на предсказания модели и интерпретировать результаты.
  • Знает основные инструменты и библиотеки для машинного обучения и умеет использовать их в практическом анализе данных
  • Готов к работает в междисциплинарных командах, критически оценивать модели и адаптировать современные технологии для биологических и медицинских задач.
Содержание учебной дисциплины

Содержание учебной дисциплины

  • Введение в биологические данные и нейронные сети
  • Предобработка данных в анализе биологических данных
  • Основы статистического анализа биологических данных
  • Основы нейронных сетей
  • Сверточные нейронные сети (CNN) для анализа изображений
  • Рекуррентные нейронные сети (RNN) для анализа последовательных данных и временных рядов
  • Продвинутые архитектуры для анализа биологических данных
  • Трансферное обучение в анализе биологических данных
  • Интерпретация и объяснимость моделей
  • Практические приложения и будущее в анализе биологических данных
Элементы контроля

Элементы контроля

  • неблокирующий Домашнее задание
  • неблокирующий Итоговый проект
Промежуточная аттестация

Промежуточная аттестация

  • 2024/2025 4th module
    0.5 * Домашнее задание + 0.5 * Итоговый проект
Список литературы

Список литературы

Рекомендуемая основная литература

  • Deep learning, Kelleher, J. D., 2019
  • Neural Networks and Deep Learning - CCBY4_068 - Michael Nielson - 2022 - Open Educational Resources: libretexts.org - https://ibooks.ru/bookshelf/390854 - 390854 - iBOOKS

Рекомендуемая дополнительная литература

  • Introduction to deep learning, Charniak, E., 2018

Авторы

  • Яхина Мария Рафаиловна