Диссертации, представленные на защиту и подготовленные в НИУ ВШЭ
Сортировка:по дате защитыпо имени научного руководителяпо имени соискателя
Показаны работы: 1 - 2 из 2
Вычислительные методы для аннотирования данных тандемной масс-спектрометрииДокторская диссертацияУченая степень НИУ ВШЭ
Tandem mass spectrometry has become the standard method to identify molecules and proteins in complex biological mixtures (e.g. blood drops), and the data obtained is routinely analyzed with computer programs. Roughly, 50-80% of the data cannot be annotated with high confidence due the following issues: (1) low discriminative power of the score functions, i.e. the ability to discriminate between correct and incorrect annotations, (2) raw scores are not calibrated properly and lack universal semantics, (3) incomplete candidate peptide sets, i.e. the correct peptide is not included to the reference set possibly due to a post-translational modification (PTMs), (4) noise, i.e. the mass spectrometer produces considerably amount of noise in the spectra, and (5) detector/Instrument accuracy. The dissertation presents novel computational methods to tackle down the issues 1-4 and they achieved state-of-the-art performance in data annotation at the time of their publication. Therefore, more accurate data identification and spectrum annotation can be obtained which and experimenters and practitioners can conclude correct conclusions about their experiments and to make proper decisions for future experiments or clinical therapies, for instance, in selecting the right drug therapy.
Ключевые слова:
Диссертация [*.pdf, 39.44 Мб] (дата размещения 3/4/2022)
Резюме [*.pdf, 9.46 Мб] (дата размещения 3/4/2022)
Summary [*.pdf, 10.76 Мб] (дата размещения 3/4/2022)
Обучение генеративных вероятностных моделей для распознавания данных масс-спектрометрииКандидатская диссертацияУченая степень НИУ ВШЭ
Соискатель:
Сулимов Павел Андреевич
Руководитель:
Дисс. совет:
Совет по компьютерным наукам
Дата защиты:
9/9/2020
Масс-спектрометрия используется для изучения и идентификации молекул в биологических образцах. Неправильная аннотация масс-спектра может привести к тому, что будут сделаны ложные выводы о результатах экспериментов и, как следствие, приняты неверные решения, например, при выборе правильной лекарственной терапии. В связи с этим важно иметь надежные и точные методы для аннотирования и идентификации масс-спектров, в независимости от протокола эксперимента. В ходе диссертационного исследования был разработан новый интерпретируемый метод BoltzMatch, основанный на стохастической нейронной сети. Предложен новый непараметрический метода калибровки рейтингов Tailor для обеспечения сопоставимости рейтингов между масс-спектрами. Разработан новый метод диверсифицирующей регуляризации, помогающей при обучении произвольных глубоких стохастических нейронных сетей. Показано, что методы машинного обучения могут переобучаться на данных масс-спектрометрии, в результате чего происходит смещение оценок из-за переусложнения модели.
Диссертация [*.pdf, 17.27 Мб] (дата размещения 7/6/2020)
Резюме [*.pdf, 3.76 Мб] (дата размещения 7/6/2020)
Summary [*.pdf, 3.58 Мб] (дата размещения 7/6/2020)