Мы используем файлы cookies для улучшения работы сайта НИУ ВШЭ и большего удобства его использования. Более подробную информацию об использовании файлов cookies можно найти здесь, наши правила обработки персональных данных – здесь. Продолжая пользоваться сайтом, вы подтверждаете, что были проинформированы об использовании файлов cookies сайтом НИУ ВШЭ и согласны с нашими правилами обработки персональных данных. Вы можете отключить файлы cookies в настройках Вашего браузера.

  • A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Улучшение аналитической СУБД ClickHouse

ФИО студента: Бардуков Анатолий Андреевич

Руководитель: Пузыревский Иван Витальевич

Кампус/факультет: Факультет компьютерных наук

Программа: Прикладная математика и информатика (Бакалавриат)

Оценка: 8

Год защиты: 2018

Работа посвящена улучшению и расширению возможностей компрессии данных в колоночной СУБД ClickHouse. Разработанные модули станут частью open source проекта ClickHouse и позволят пользователям специфицировать методы сжатия для отдельных колонок в таблицах. Кроме того, разработанное решение позволяет последовательно применять несколько кодеков к одному блоку данных, что позитивно сказывается на качестве сжатия данных и, как следствие, повышает пропускную способность СУБД за счёт уменьшения количества операций с жёстким диском. Решение дополнит существующую систему сжатия, которая в данный момент является единой для всех колонок всех таблиц, а также не предлагает возможности комбинировать алгоритмы сжатия и фильтры. Также, текущее решение не позволяет изменить алгоритм сжатия без перезагрузки сервера ClickHouse, что учтено в работе и доступно средствами языка определения данных. Помимо этого, проведена работа по изучению конкурирующих систем колоночных баз данных, учтены как внутренние тесты производительности, так и независимые исследования. Предложенное решение основано на опыте других компаний и учитывает их лучшие стороны, при этом расширяя и обобщая их подход в применении кодеков к данным. Ключевые слова: колоночные базы данных, СУБД, open source, алгоритмы компрессии, фильтры, OLAP.

Текст работы (работа добавлена 21 мая 2018 г.)

Выпускные квалификационные работы (ВКР) в НИУ ВШЭ выполняют все студенты в соответствии с университетским Положением и Правилами, определенными каждой образовательной программой.

Аннотации всех ВКР в обязательном порядке публикуются в свободном доступе на корпоративном портале НИУ ВШЭ.

Полный текст ВКР размещается в свободном доступе на портале НИУ ВШЭ только при наличии согласия студента – автора (правообладателя) работы либо, в случае выполнения работы коллективом студентов, при наличии согласия всех соавторов (правообладателей) работы. ВКР после размещения на портале НИУ ВШЭ приобретает статус электронной публикации.

ВКР являются объектами авторских прав, на их использование распространяются ограничения, предусмотренные законодательством Российской Федерации об интеллектуальной собственности.

В случае использования ВКР, в том числе путем цитирования, указание имени автора и источника заимствования обязательно.

Реестр дипломов НИУ ВШЭ