• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта
Магистратура 2020/2021

Современные методы принятия решений: Алгоритмы в биоинформатике

Лучший по критерию «Полезность курса для Вашей будущей карьеры»
Лучший по критерию «Полезность курса для расширения кругозора и разностороннего развития»
Лучший по критерию «Новизна полученных знаний»
Статус: Курс обязательный (Анализ данных в биологии и медицине)
Направление: 01.04.02. Прикладная математика и информатика
Когда читается: 1-й курс, 3, 4 модуль
Формат изучения: без онлайн-курса
Преподаватели: Миронов Андрей Александрович, Спирин Сергей Александрович
Прогр. обучения: Анализ данных в биологии и медицине
Язык: русский
Кредиты: 5
Контактные часы: 64

Программа дисциплины

Аннотация

Цель освоения дисциплины «Алгоритмы биоинформатики последовательностей» — общий обзор базовых алгоритмов биоинформатики последовательностей. Студенты овладеют знаниями об основных алгоритмах, применяемых в анализе биологических последовательностей, таких, как выравнивание, поиск паттернов, множественные выравнивания, структры РНК. После окончания курса студенты смогут свободно читать литературу, связанную с биоинформатикой последовательностей а также проводить элементарные самостоятельные исследования.
Цель освоения дисциплины

Цель освоения дисциплины

  • Провести общий обзор базовых алгоритмов биоинформатики последовательностей. Студенты овладеют знаниями об основных алгоритмах, применяемых в анализе биологических последовательностей, таких, как выравнивание, поиск паттернов, множественные выравнивания, предсказание структур структры РНК. После окончания курса студенты смогут свободно читать научную литературу, связанную с биоинформатикой последовательностей а также проводить элементарные самостоятельные исследования.
Планируемые результаты обучения

Планируемые результаты обучения

  • Знать основы Байесового подхода
  • Знать основные алгоритмы анализа последовательностей
  • Уметь критически анализировать научные статьи, связанные с биоинформатикой.
Содержание учебной дисциплины

Содержание учебной дисциплины

  • Структура задач биоинформатики
    Понятие о формализации задачи, Понятие о золотом стандарте
  • Введение в Байесову вероятность
    Байесова статистика. Априорное и апостериорное распределение. Распределение Дирихле. Оценка правдоподобия, матожидания и апостериорная оценка. Оценка параметров по результатам наблюдения.
  • Вероятностные модели последовательностей
    Вероятностные модели последовательностей. Бернуллиевская модель, Марковская модель, модель выборки последовательности и данных.
  • Выравнивание последовательностей
    Алгоритмы, основанные на динамическом программировании, хеширование, вероятностные оценки значимости
  • Множественное выравнивание последовательностей
    Основные подходы. Поняти об информационном содержании. Динамическое прграммирование. Прогрессивное выравнивание, применение СММ Псевдоотсчеты. Взвешивание последовательностей. Метод Герштейна-Сонхаммера-Чотьи.
  • Скрытые Марковские модели
    Понятие о СММ. Основные алгоритмы, оценка параметров, примеры использования в боинформатике
  • Локальное множественное выравнивание. Поиск сигналов
    Поиск сигналов. Постановка задачи. Алгоритм MEME. Гиббс сэмплер.
  • Вторичная структура РНК
    Вторичная структура РНК. Элементы вторичной структуры. Энергия вторичной структуры РНК. Комбинаторный метод предсказания вторичной структуры. Алгоритм Нуссинофф. Алгоритм Зукера. Субоптимальные структуры. Консенсусные вторичные структуры. Метод ковариций. Контекстно-свободные грамматики и вторичная структура РНК.
  • Журнальный клуб
    Разбор статей.
Элементы контроля

Элементы контроля

  • неблокирующий Домашнее задание 1
  • неблокирующий Контрольная работа 1
  • неблокирующий Домашнее задание 2
  • неблокирующий Лабораторная работа
  • блокирующий Выступление с презентацией
  • неблокирующий Контрольная работа 2
  • неблокирующий Экзамен (устный)
Промежуточная аттестация

Промежуточная аттестация

  • Промежуточная аттестация (4 модуль)
    ДЗ1. Построить апостериорное распределение при заданном априорном распределении и наблюдениях. Сделать оценки E,MAP КР1. Контрольная работа по теории выравниваний. Вопросы с множественным выбором. Правильный ответ +1; неправильный -1. ДЗ2 запрограммировать на питоне парное выравнивание. Представить тесты работы программы. ЛР1. Надо с помощью электронной таблицы восстановить последовательность состояний скрытой марковской модели двумя алгоритмами. Если студент предпочтет написание программы, то должны быть представлены тесты. ПР1. Надо разобрать одну из предложенных статей, сделать презентацию, провести критический разбор. КР2. Предлагается контрольная работа с тремя разделами. Раздел А -- вопросы с множественным выбором. За правильный ответ +1 балл, за неправильный -1 балл. Раздел В. провести вычисления, например, информационного содержания мотива. Раздел С. Кратко написать, например, известные студенту методы множественного выравнивания с их характеристиками. При оценке контрольной кр2 используется формула (X-15), где X -- число баллов, набранных по ответам на вопросы. Э1. Стандарный устный экзамен. Каждый билет содержит два вопроса, потом задаются дополнительные вопросы. Формула оценки: (дз1*5+кр1*5+лр1*10+пр1*20+дз2*5+кр2*20+э1*35)/10 Каждый элемент оценивается от 0 до 10.
Список литературы

Список литературы

Рекомендуемая основная литература

  • Анализ биологических последовательностей : вероятностные модели белков и нуклеиновых кислот, , 2006

Рекомендуемая дополнительная литература

  • Leimkuhler, B. (2006). New Algorithms for Macromolecular Simulation. Berlin: Springer. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=156588