Магистратура
2020/2021
Научно-исследовательский семинар "Вычислительная филогенетика"
Статус:
Курс обязательный (Анализ данных в биологии и медицине)
Направление:
01.04.02. Прикладная математика и информатика
Кто читает:
Кафедра технологий моделирования сложных систем
Где читается:
Факультет компьютерных наук
Когда читается:
2-й курс, 1, 2 модуль
Формат изучения:
без онлайн-курса
Преподаватели:
Спирин Сергей Александрович
Прогр. обучения:
Анализ данных в биологии и медицине
Язык:
русский
Кредиты:
7
Контактные часы:
46
Программа дисциплины
Аннотация
Научно-исследовательский семинар "Вычислительная филогенетика" призван познакомить студентов с алгоритмами и программами, используемыми для реконструкции филогении биополимеров по их последовательностям и филогении организмов по их биополимерам
Цель освоения дисциплины
- Познакомить студентов программы АДБМ с алгоритмами и программами реконструкции филогении по последовательностям
Планируемые результаты обучения
- Понимание студентами терминологии, относящейся к теории филогенетических деревьев и их формализации в алгоритмах и компьютерных программах. Знание форматов файлов.
- Знание общей схемы реконструкции филогении. Знание классификации алгоритмов реконструкции филогении и свойств алгоритмов разных классов
- Знание принципов оценки эволюционного расстояния между последовательностями по заданному выравниванию
- Знание алгоритмов поиска субоптимального дерева в пространстве всех деревьев. Знание основных свойств этих алгоритмов.
- Знание основных показателей качества дерева: максимальной экономии, максимального правдоподобия, дистанционных показателей.
- Знание алгоритмов UPGMA и Neighbor-joining
- Знакомство с приёмами, позволяющими выбрать укоренение филогенетического дерева.
- Знакомство с приёмами "бутстреп" и "складной нож". Понимание смысла чисел, отображающих поддержку ветвей дерева.
- Знакомство с некоторыми исследованиями последних лет по алгоритмам реконструкции филогении.
- Приобретение опыта чтения специальной литературы и изложения полученных знаний в виде краткого доклада с презентацией
- Знакомство на практике с задачей реконструкции филогении какого-либо конкретного набора биополимеров
Содержание учебной дисциплины
- Комбинаторика филогенетических деревьевТерминология (лист, ветвь, узел, клада, корень). Топология дерева как набор разбиений множества листьев. Смысл длин ветвей. Число различных разрешённых деревьев с n листьями (укоренённых и неукоренённых). Что такое “ультраметричность” (применительно к филогенетическому дереву)
- Принципиальная схема реконструкции филогенииДистанционные и символьные методы. Прямые и переборные методы.
- Оценка эволюционных расстояний между последовательностямиФормула Джукса – Кантора (Jukes-Cantor) Оценка эволюционного расстояния по принципу максимального правдоподобия
- Поиск в пространстве деревьевВыращивание дерева (stepwise addition). Схема поиска просмотром соседних деревьев. Локальная перестройка дерева (Ntarest neighbor interchnge, NNI). Глобальная перестройка дерева (Subtree pruning and regrafting, SPR). Markov chain Monte Carlo (MCMC).
- Критерии качества дереваМаксимальная экономия (maximum parsimony) Максимальное правдоподобие (maximum likelihood) Минимальная эволюция (minimum evolution) Наименьшие квадраты (OLS = Ordinary least squares, Fitch – Margoliash)
- Прямые методы реконструкции филогенииАлгоритм UPGMA. Алгоритм объединения соседей (Neighbor-joining)
- Укоренение филогенетических деревьевУкоренение в среднюю точку (midpoint). Внешняя группа (outgroup).
- Поддержка ветвей дереваПриёмы bootstrap и "складной нож" (jackknife)
- Журнальный клубДоклады студентов с разбором статей по алгоритмам работы с филогенетическими деревьями
- Практическая работаСамостоятельная работа студентов по реконструкции филогении набора организмов
Элементы контроля
- Контрольная работа
- Контрольная работа
- Контрольная работа
- Доклад на журнальном клубеСтудент выбирает статью из предложенного списка, изучает её и делает презентацию на 30-40 минут на семинаре
- Практическая работаСтудент выполняет работу по филогенетической реконструкции, присылает письменный отчёт о результатах и делает краткий (5-7 мин.) доклад на семинаре
- ЭкзаменЭкзамен состоит из двух частей: на первой студент кратко рассказывает о статье, которую докладывал на журнальном клубе другой студент, на второй отвечает на теоретические вопросы.
- Контрольная работа
- Контрольная работа
- Контрольная работа
- Доклад на журнальном клубеСтудент выбирает статью из предложенного списка, изучает её и делает презентацию на 30-40 минут на семинаре
- Практическая работаСтудент выполняет работу по филогенетической реконструкции, присылает письменный отчёт о результатах и делает краткий (5-7 мин.) доклад на семинаре
- ЭкзаменЭкзамен состоит из двух частей: на первой студент кратко рассказывает о статье, которую докладывал на журнальном клубе другой студент, на второй отвечает на теоретические вопросы.
Промежуточная аттестация
- Промежуточная аттестация (2 модуль)0.3 * Доклад на журнальном клубе + 0.06 * Контрольная работа + 0.07 * Контрольная работа + 0.07 * Контрольная работа + 0.25 * Практическая работа + 0.25 * Экзамен
Список литературы
Рекомендуемая основная литература
- Bioinformatics for Evolutionary Biologists: A Problems Approach. Haubold, B., Börsch-Haubold, A. Springer International Publishing, 2017. eBook ISBN 978-3-319-67395-0.
Рекомендуемая дополнительная литература
- Анализ биологических последовательностей : вероятностные модели белков и нуклеиновых кислот, , 2006