Рыжиков Артём Сергеевич

Полномочия / обязанности

Аналитик

Oбразование

2018

Магистратура: Национальный исследовательский университет «Высшая школа экономики», специальность «Прикладная математика и информатика», квалификация «Магистр»

2015

Бакалавриат: Новосибирский национальный исследовательский государственный университет, специальность «Физика», квалификация «Бакалавр»

Достижения и поощрения

Благодарственное письмо проректора НИУ ВШЭ (сентябрь 2022)
Надбавка за публикацию в международном рецензируемом научном издании (2022–2023, 2021–2022)
Надбавка за регулярные публикации в международных рецензируемых научных изданиях (2024–2029)

Учебные курсы (2024/2025 уч. год)

Генеративные модели в машинном обучении (Бакалавриат; где читается: Факультет компьютерных наук; 4-й курс, 3 модуль)рус
Генеративные модели в машинном обучении (углубленный курс) (Бакалавриат; где читается: Факультет экономических наук; 3-й курс, 3, 4 модуль)рус
Генеративные модели в машинном обучении (углубленный курс) (Бакалавриат; где читается: Факультет компьютерных наук; 3-й курс, 3, 4 модуль)рус
Архив учебных курсов

Расписание занятий на сегодня

Расписание занятий по физической культуре в спортивных секциях

Полное расписание

Диссертация на соискание учёной степени кандидата наук

2024
Рыжиков А. С. Глубокие порождающие модели для поиска аномалий

Конференции

2017
ACAT 2017 (Seattle). Доклад: Domain adaptation with gradient reversal for MC/real data calibration

Авторские права и патенты

№ п/п	Номер РИД	Вид РИД	Наименование РИД	Сведения о регистрации	Авторы
1	5.0008-2024	Программа для ЭВМ	Библиотека классификации состояний промышленных электродвигателей методами ИИ по токовому сигналу	2024663151	Али Сараа, Рыжиков Артём Сергеевич, Деркач Денис Александрович, Красноженов Григорий Григорьевич
2	8.0087-2021	Произведение	МООК "Deep Generative Models"		Устюжанин Андрей Евгеньевич, Рамазян Тигран Арменович, Деркач Денис Александрович, Рыжиков Артём Сергеевич, Гарин Владимир Юрьевич

Опыт работы

Рыжиков Артём Сергеевич

О себе

Закончил бакалавриат кафедры Физики Элементарных Частиц Физического факультета Новосибирского Государственного Университета. Занимался физикой высоких энергий в Институте Ядерной Физики им. Будкера. В свободное время занимался космологией, теоретической физикой, топологией и дифференциальной геометрией.

C 2015 года занимаюсь анализом больших данных и машинном обучением. Большой опыт участия в различных Data Science, Big Data и HighLoad – проектах. Выпускник ШАД. Сейчас занимаюсь исследованиями по применению машинного обучения в физике высоких энергий. С июля 2017 года являюсь действующим сотрудником (стажер-исследователь) лаборатории анализа больших данных НИУ ВШЭ.

Веду лекции по курсу “Искусственный интеллект и большие данные” в рамках программы Data Culture НИУ ВШЭ. Ранее вёл семинары по курсу “Современные методы машинного обучения” НИУ ВШЭ.

Область интересов

Физика Высоких Энергий
Машинное обучение
Обучение с подкреплением
Байесовские методы машинного обучения
Глубинное обучение
Этическое машинное обучение

Компетенции

Programming (Python/Scala/Java)
Big Data - ETL (Elastic Search/Solr), Spark, DataStax Enterprise, Hive, NoSQL (Cassandra/DynamoDB), AWS (DynamoDB/SQS/SNS/S3)
Machine Learning - Supervised/Unsupervised Learning, Deep Learning, Reinforcement learning, Bayes ML, Ethic ML
SQL/Queues - PostgreSQL, Redis, RabbitMQ
Others – Docker (+Rancher), Telegram Bots

Научные достижения

В рамках своей курсовой работы 1 курса магистерской программы ФКН ВШЭ успешно реализовал нейросеть, способную обучаться на Монте-Карло событиях без переобучения, давая сравнимое качество классификации на реальных событиях. Данная работа имеет огромную важность для применения глубинного машинного обучения к идентификации элементарных частиц в физике высоких энергий. С этой работой мы успешно выступили на международной конференции ACAT 2017 и на данный момент публикуем статью, посвященную данному методу.

В рамках своей дипломной магистерской работы успешно реализовал глубинную нейросеть с плоским профилем эффективности. Работа проводилась в рамках гранта РНФ (см. ниже). Полученные в ходе исследования результаты позволили обучать модели глубинного обучения, одинаково хорошо работающие в разных регионах значений интересующих нас переменных. Такие модели машинного обучения представляют огромный интерес в физике высоких энергий, в частности в идентификации элементарных частиц. Ранее никому не удавалось обучать нейросети с таким свойством. По данной работе также планируется публикация и доклад.

Гранты

Организация РНФ

Программа «Проведение исследований научными группами под руководством молодых ученых»

Название “Поиск новой физики в данных LHCb с применением методов глубокого обучения”

Номер 17-72-20127

Публикации

Ustyuzhanin A., Рыжиков А. С. Кросс-доменная адаптация с помощью нейронных сетей на прямом распространении ошибки // ACAT Proceedings 2017, USA. 2017 (в печати)

Конференции

Ustyuzhanin A., Рыжиков А. С. Кросс-доменная адаптация с помощью нейронных сетей на прямом распространении ошибки // ACAT 2017, USA. 2017

Преподавание

Семинары, майнор Современные методы машинного обучения, НИУ ВШЭ (Высшая Школа Экономики), 2017
Лекции, Искусственный интеллект и большие данные, Data Culture, НИУ ВШЭ, 2018

Образование

Новосибирская Физико-Математическая Школа (СУНЦ НГУ)

Год выпуска: 2011

Средний балл: 4.9

Достижения:

• Многократный призёр Всесибирской олимпиады школьников по Физике (2009-2011)

• Многократный призёр Всесибирской олимпиады школьников по Математике (2009-2010)

• Победитель Всесибирской олимпиады школьников по Физике (2009, 2011)

• Победитель регионального этапа Всероссийской олимпиады школьников по Физике (2011)

Новосибирский Государственный Университет (НИУ НГУ)

Форма обучения: дневная, очная

Степень: Бакалавр

Год выпуска: 2015

Факультет: Физический

Направление: Кафедра Физики Элементарных Частиц

Средний балл: 4.5

Выпускной диплом: Калибровка калориметров на основе тяжелых кристаллов (NaI, BGO) по краю спектра однократного тормозного и Комптоновского излучений с использованием генератора Монте-Карло

Достижения:

• Победитель Всероссийской студенческой олимпиады по математике ("Магистратура МФТИ", МФТИ, 2015, 1-е абсолютное место)

• Призёр Всероссийской студенческой олимпиады по физике ("Магистратура МФТИ", МФТИ, 2015)

• Победитель Новосибирской региональной студенческой олимпиады по теоретической и прикладной механике (2014)

• Многократный победитель студенческой олимпиады НГУ по теоретической и прикладной механике (2014-2015)

Высшая Школа Экономики (НИУ ВШЭ)

Форма обучения: дневная, очная

Степень: Магистр

Дата окончания: 2018

Факультет: Computer Science

Направление: Data Science

Graduating diploma: Обучение нейросетей с равномерным профилем эффективности для детектирования элементарных частиц

Дополнительные курсы

ШАД (Школа Анализа Данных, Яндекс)

Форма образования: очная, Новосибирский филиал

Дата окончания: 2017

Направление: Computer Science

Курсы:

• Algorithms and Data Structures of Search 1, 2

• Discrete Math and Statistics

• C++

• Parallel and Distributed Calculations

• Python

• Machine Learning 1, 2

• Deep learning

• Reinforcement learning

• Bayes machine learning

Языки

• Русский (Native)

• English (Upper-Intermediate). Fluent reading and writing

Опыт работы

Организация LAMBDA (лаборатория анализа больших данных НИУ ВШЭ)

Позиция: стажер-исследователь

Период: 15.07.2017-н.в.

Обязанности:

Тестирование и формулирование гипотез
Изучение статей по современным исследованиям в области ML
Применение современных методов машинного обучения

Задачи:

Исследование современных методов в применении к идентификации частиц в физике высоких энергий
Обучение и тестирование архитектур нейросетей с кросс-доменной адаптацией, инвариантных относительно Монте-Карло данных
Обучение и тестирование архитектур

Используемые технологии:

Deep Learning – Keras, Tensorflow, Lasagne
Machine Learning - SkLearn
Programming - Python

Достижения и опыт:

Удалось без значимой потери качества обучить нейросеть. Это позволило обучать нейросети, одинаково работающие при детектировании Монте-Карло и реальных событий
Удалось обучить нейросеть с инвариантным по задаваемым переменным качеством. Это позволило обучать нейросети для распознавания событий с одинаковой эффективностью вдоль импульса частицы

Организация Teleport

Позиция: Machine Learning Expert / Senior Data Scientist

Период: 29.02.2017-31.08.2017

Обязанности:

Тестирование и формулирование гипотез
Обучение глубинных нейросетей
Изучение статей по современным исследованиям в области Deep Learning (Image Segmentation) и Computer Vision, их реализация и тестирование

Задачи:

Исследование современных подходов в компьютерном зрении и глубинном обучении
Сегментация фото и видео
Edge detection
Постпроцессинг
Участие в реализации закрытого фреймворка для глубинного обучения, основанного на Tensorflow

Используемые технологии:

Deep Learning - Tensorflow
Computer vision - OpenCV
Programming – Python, С++

Достижения и опыт:

За короткие сроки разобрался в современных методах применения глубинного обучения к задачам компьютерного зрения
Внёс значимый вклад в виде эффективного высокопроизводительного постпроцессинга сегментированных изображений (IoU увеличился на 3%, улучшилось визуальное качество)
Реализовал эффективную и быструю архитектуру нейросети для сегментации видео
Получил очень хороший опыт работы с глубинным обучением на Tensorflow

Организация Double Data

Позиция: Full-Stack Data Scientist/Scala Developer

Период: 01.05.2016-15.02.2017

Обязанности:

Тестирование и формулирование гипотез
Обучение, тестирование и деплой ML-моделей
Написание кода
Обработка больших данных

Задачи:

Реализация закрытого инструмента для поиска людей в социальных сетях

Тестирование гипотез и построение ML-моделей (pointwise-) ранжирования
Построение Data Lake – витрины данных
Обработка больших (200 Тб) данных на Spark. Оптимизация Spark-джоб
Анализ социальных графов (> 1Тб) на Spark
Написание и тестирование кода для поискового движка
Разведочных анализ данных
Построение моделей кредитного скоринга

Используемые технологии:

Machine Learning – t-SNE, SkLearn, XGBoost
Python – Flask, PySpark, PyTest
Scala – Akka, Akka Http, JUnit, Mockito
Big Data – Spark, ElasticSearch ETL

Достижения и опыт:

В команде из 4 человек за 3 месяца с нуля реализовали поисковый движок, позволивший находить 60% (Recall) заёмщиков с 5% (1 – Precision) ошибкой
Получил опыт обработки реально больших (>200 Тб) данных на Apache Spark. Научился эффективно оптимизировать Spark-джобы
В хорошей степени овладел навыками анализа данных и визуализации на Python
Очень много попрактиковал TDD-подход к написанию HighLoad-кода

Организация SurfingBird

Позиция: Full-Stack Data Scientist/Scala Developer

Период: 19.10.2015-29.04.2016

Обязанности:

Тестирование и формулирование гипотез
Написание кода
Обработка больших данных

Задачи:

Разработка, оптимизация и поддержка архитектуры рекомендательного движка
Разработка, мониторинг и поддержка рекомендательных алгоритмов
Сегментация пользователей (в т.ч. Realtime)
Выделение ядра пользователей

Используемые технологии:

Machine Learning – Topic Modeling, Sentiment Analysis, Recommendations, Clustering, SVD, PLSA, LDA
Programming – Python, Scala, Java, SQL, PostgreSQL, Redis, RabbitMQ
Big Data – Spark, SparkML, ElasticSearch ETL, Solr ETL, Cassandra, DataStax Enterprise

Достижения и опыт:

• Разработал и внедрил в production очень эффективный алгоритм стриминговой сегментации пользователей. Впоследствии это позволило решить проблему холодного старта для площадок с очень разреженным трафиком. Такая сегментация пользователей по контенту давала CTR, отличающийся на 0.09% от стандартных алгоритмов коллаборативной фильтрации. Это очень хороший результат для латентных моделей рекомендательных систем

• Очень эффективно оптимизировал некоторые алгоритмы рекомендательной системы на Spark. В некоторых случаях это ускорило время расчёта алгоритмов в 5 (!) раз. Как следствие, очень большой прирост CTR

• Проделал очень большой рефакторинг legacy-кода (порядка 4к строк Scala-кода)

• Разработал новые, очень эффективные, рекомендательные алгоритмы (Включая модели sentiment analysis и topics modeling)

• Оптимизировал запросы в ElasticSearch. На некоторых очень крупных рекомендательных площадках это дало относительный прирост CTR на 45% (!)

• Научился применять Spark для аналитики и агрегации больших данных

• Написал алгоритм предсказания популярности страниц по репостам в соцсетях

• Написал распределённую систему для онлайнового пересчёта рекомендаций

• Сделал очень много различных отчётов с использованием Python, Spark и SQL

Информация^*

Общий стаж: 10 лет

Данные выводятся в соответствии с требованиями приказа N 831 от 14 августа 2020 г. Федеральной службы по надзору в сфере образования и науки

15

апр.

2020

Три сотрудника лаборатории стали лауреатами стипендии имени Ильи Сегаловича 2020

13 апреля состоялась трансляция, на которой были оглашены лауреаты стипендии имени Ильи Сегаловича на 2020 год.

21

авг.

2019

Первый семинар на Покровке

Лаборатория методов анализа больших данных переехала в новый кампус ВШЭ по адресу Покровский бульвар, д 11, строение 4

Рыжиков Артём Сергеевич

Полномочия / обязанности

Oбразование

Достижения и поощрения

Учебные курсы (2024/2025 уч. год)

Учебные курсы (2023/2024 уч. год)

Учебные курсы (2022/2023 уч. год)

Учебные курсы (2021/2022 уч. год)

Учебные курсы (2020/2021 уч. год)

Расписание занятий на сегодня

Диссертация на соискание учёной степени кандидата наук

Конференции

Авторские права и патенты

Опыт работы

Информация^*

Три сотрудника лаборатории стали лауреатами стипендии имени Ильи Сегаловича 2020

Первый семинар на Покровке

Рыжиков Артём Сергеевич

Полномочия / обязанности

Oбразование

Достижения и поощрения

Учебные курсы (2024/2025 уч. год)

Учебные курсы (2023/2024 уч. год)

Учебные курсы (2022/2023 уч. год)

Учебные курсы (2021/2022 уч. год)

Учебные курсы (2020/2021 уч. год)

Расписание занятий на сегодня

Диссертация на соискание учёной степени кандидата наук

Конференции

Авторские права и патенты

Опыт работы

Информация*

Три сотрудника лаборатории стали лауреатами стипендии имени Ильи Сегаловича 2020

Первый семинар на Покровке

Информация^*