Обучение генеративных вероятностных моделей для распознавания данных масс-спектрометрииLearning generative probabilistic models for mass spectrometry data identification
Соискатель:
Сулимов Павел Андреевич
Руководитель:
Члены комитета:
Горшков Михаил Владимирович (Федеральный исследовательский центр химической физики им. Н.Н. Семенова РАН, кандидат физико-математических наук, председатель комитета), Мунд Андреас (Университет Копенгагена, PhD, член комитета), Онето Лука (Университет Генуи, PhD, член комитета), Перес-Риверол Яссет (Европейский институт биоинформатики (Великобритания), PhD, член комитета), Понгор Шандор (Католический университет Петера Пазманя (Венгрия), Doctor of Sciences, член комитета)
Диссертация принята к предварительному рассмотрению:
7/6/2020
Диссертация принята к защите:
8/18/2020 (протокол №10)
Дисс. совет:
Совет по компьютерным наукам
Дата защиты:
9/9/2020
Масс-спектрометрия используется для изучения и идентификации молекул в биологических образцах. Неправильная аннотация масс-спектра может привести к тому, что будут сделаны ложные выводы о результатах экспериментов и, как следствие, приняты неверные решения, например, при выборе правильной лекарственной терапии. В связи с этим важно иметь надежные и точные методы для аннотирования и идентификации масс-спектров, в независимости от протокола эксперимента. В ходе диссертационного исследования был разработан новый интерпретируемый метод BoltzMatch, основанный на стохастической нейронной сети. Предложен новый непараметрический метода калибровки рейтингов Tailor для обеспечения сопоставимости рейтингов между масс-спектрами. Разработан новый метод диверсифицирующей регуляризации, помогающей при обучении произвольных глубоких стохастических нейронных сетей. Показано, что методы машинного обучения могут переобучаться на данных масс-спектрометрии, в результате чего происходит смещение оценок из-за переусложнения модели.
Диссертация [*.pdf, 17.27 Мб] (дата размещения 7/6/2020)
Резюме [*.pdf, 3.76 Мб] (дата размещения 7/6/2020)
Summary [*.pdf, 3.58 Мб] (дата размещения 7/6/2020)
Публикации, в которых излагаются основные результаты диссертации
Pavel Sulimov, Anastasia Voronkova, Attila Kertész-Farkas. Annotation of tandem mass spectrometry data using stochastic neural networks in shotgun proteomics (смотреть на сайте журнала)
Sulimov, P., Kertész-Farkas, A. Tailor: A Nonparametric and Rapid Score Calibration Method for Database Search-Based Peptide Identification in Shotgun Proteomics (смотреть на сайте журнала)
Danilova, Y., Voronkova, A., Sulimov, P., Kertész-Farkas, A. Bias in False Discovery Rate Estimation in Mass-Spectrometry-Based Peptide Identification (смотреть на сайте журнала)
Sulimov P., Sukmanova E., Chereshnev R., Kertész-Farkas A. Guided Layer-Wise Learning for Deep Models Using Side Information (смотреть на сайте журнала)
Отзывы
Отзыв научного руководителя
- Отзыв научного руководителя (дата размещения 7/6/2020)
Сведения о результатах защиты:
Комитет по диссертации рекомендовал присудить ученую степень кандидата наук (протокол № 2 от 09.09.2020). Решением диссертационного совета (протокол № 12 от 22.09.2020) присуждена ученая степень кандидата компьютерных наук.
См. на ту же тему
Вычислительные методы для аннотирования данных тандемной масс-спектрометрииДокторская диссертация
Соискатель: Кертес-Фаркаш Аттила
Дата защиты: 5/19/2022