Подходы машинного обучения для анализа разрывов раковых геномовMachine leraning based approaches for analysis of cancer genome breakpoints
Соискатель:
Челошкина Ксения Сергеевна
Руководитель:
Члены комитета:
Кертес-Фаркаш Аттила (НИУ ВШЭ, д.т.н., председатель комитета), Армеев Григорий Алексеевич (МГУ им. Ломоносова, к.ф.-м.н., член комитета), Иванков Дмитрий Николаевич (Сколковский институт науки и технологий, к.ф.-м.н., член комитета), Раменский Василий Евгеньевич (ФГБУ НМИЦ Терапии и профилактики медицины, к.ф.-м.н., член комитета), Фишман Вениамин Семёнович (ИЦиГ СО РАН, к.б.н., член комитета)
Диссертация принята к предварительному рассмотрению:
3/29/2023
Диссертация принята к защите:
6/9/2023
Дисс. совет:
Совет по компьютерным наукам
Дата защиты:
6/28/2023
Обнаружение и лечение рака являются первостепенными задачами науки и медицины 21 века. Сложность решения этих задач обусловлена сложностью процессов развития рака и гетерогенностью раковых мутаций в геноме. Для изучения мутационных процессов в раковых геномах, определения биомаркеров и генов-драйверов были собраны большие массивы данных раковых геномов и их различных характеристик. Однако несмотря на большое количество доступных данных, мутагенез раковых разрывов еще не был достаточно изучен и качество предсказания раковых разрывов моделями машинного обучения было намного ниже, чем для точечных раковых мутаций. Данная диссертационная работа посвящена комплексному изучению раковых разрывов с помощью методов машинного обучения. В диссертации предлагается подход по предсказанию областей повышенной плотности раковых разрывов на основе омиксных данных с помощью моделей машинного обучения. Предложенный подход был протестирован на реальных данных и превзошел другие известные на тот момент модели машинного обучения. Помимо этого, был изучен вклад различных геномных признаков в формирование областей повышенной плотности разрывов. Также было обнаружено, что области более высокой плотности разрывов более отличимы от остальных участков раковых геномов, чем участки с меньшей плотностью разрывов.
Диссертация [*.pdf, 38.28 Мб] (дата размещения 4/13/2023)
Резюме [*.pdf, 34.12 Мб] (дата размещения 4/13/2023)
Summary [*.pdf, 25.16 Мб] (дата размещения 4/13/2023)
Публикации, в которых излагаются основные результаты диссертации
Cheloshkina K., Poptsova M. Comprehensive analysis of cancer breakpoints reveals signatures of genetic and epigenetic contribution to cancer genome rearrangements (смотреть на сайте журнала)
Cheloshkina K., Bzhikhatlov I., Poptsova M. Cancer breakpoints hotspots versus individual breakpoints prediction by machine learning models (смотреть на сайте журнала)
Cheloshkina K., Poptsova M. Tissue-specific impact of stem-loops and quadruplexes on cancer breakpoints formation (смотреть на сайте журнала)
Отзывы
Отзыв научного руководителя
- Попцова Мария Сергеевна (дата размещения 3/31/2023)
Сведения о результатах защиты:
Комитет по диссертации рекомендовал присудить ученую степень кандидата компьютерных наук (протокол №2 от 28.06.2023). Решением диссертационного совета (протокол №9 от 08.09.2023) присуждена ученая степень кандидата компьютерных наук.
Ключевые слова:
См. на ту же тему
Разработка алгоритмов построения пайплайнов машинного обучения методами обработки естественного языка основанными на данныхКандидатская диссертация
Соискатель: Трофимова Екатерина Алексеевна
Руководитель: Устюжанин Андрей Евгеньевич
Моделирование репродуктивного поведения россиян в периоды шоков 2000-2023 годовКандидатская диссертация
Соискатель: Горский Дмитрий Ильич
Руководитель: Вакуленко Елена Сергеевна
Приложение машинного обучения к теоретико-игровым задачам: аукционы и марковские игрыКандидатская диссертация
Соискатель: Иванов Дмитрий Игоревич
Руководитель: Нестеров Александр Сергеевич
Дата защиты: 12/27/2024