Кольцов Сергей Николаевич
- Ведущий научный сотрудник: НИУ ВШЭ в Санкт-Петербурге / Санкт-Петербургская школа социальных наук / Лаборатория социальной и когнитивной информатики
- Профессор: НИУ ВШЭ в Санкт-Петербурге / Санкт-Петербургская школа физико-математических и компьютерных наук / Департамент информатики
- Академический руководитель образовательной программы: Прикладной анализ данных и искусственный интеллект
- Начал работать в НИУ ВШЭ в 2016 году.
Oбразование и учёные степени
Дополнительное образование / Повышение квалификации / Стажировки
January 2003- August 2004. PostDoc position at the Max Plank Institute fur festkorperforshung, Stuttgart, Germany. November 2002-December 2002. Guest Researcher at the Max Plank Institute fur festkorperforshung, Stuttgart, Germany. January 2002- May 2002. Guest Researcher at the London School of Economics, London, England.
Достижения и поощрения
- Благодарность НИУ ВШЭ - Санкт-Петербург (май 2020)
- Благодарность НИУ ВШЭ - Санкт-Петербург (май 2020)
- Благодарность НИУ ВШЭ - Санкт-Петербург (декабрь 2016)
- Благодарность НИУ ВШЭ - Санкт-Петербург (июнь 2015)
- Благодарность НИУ ВШЭ - Санкт-Петербург (апрель 2014)
Персональная надбавка ректора (2021–2022)
Надбавка за защиту докторской диссертации (2023–2026)
Надбавка за публикацию в журнале из Списка А (и приравненном к нему научном издании) (2024–2025, 2023–2024)
Надбавка за публикацию в международном рецензируемом научном издании (2022–2023, 2020–2021, 2019–2020, 2017–2019)
Надбавка за статью в зарубежном рецензируемом журнале (2014–2016)
Учебные курсы (2024/2025 уч. год)
- Глубокое обучение (Магистратура; где читается: Санкт-Петербургская школа физико-математических и компьютерных наук; 2-й курс, 1, 2 модуль)рус
- Архив учебных курсов
Учебные курсы (2023/2024 уч. год)
- Глубинное обучение (Бакалавриат; где читается: Санкт-Петербургская школа физико-математических и компьютерных наук; 3-й курс, 3, 4 модуль)рус
- Deep Learning (Маго-лего; 3, 4 модуль)Анг
- Глубокое обучение (Маго-лего; 1, 2 модуль)рус
- Deep Learning (Магистратура; где читается: Санкт-Петербургская школа физико-математических и компьютерных наук; 1-й курс, 3, 4 модуль)Анг
- Глубокое обучение (Магистратура; где читается: Санкт-Петербургская школа физико-математических и компьютерных наук; 2-й курс, 1, 2 модуль)рус
- Text mining: Advanced Level (Маго-лего; 1 модуль)Анг
- Обработка естественного языка (Бакалавриат; где читается: Санкт-Петербургская школа физико-математических и компьютерных наук; 4-й курс, 3 модуль)рус
- Обработка естественного языка (Маго-лего; 3, 4 модуль)рус
- Обработка естественного языка (Магистратура; где читается: Санкт-Петербургская школа физико-математических и компьютерных наук; 1-й курс, 3, 4 модуль)рус
Учебные курсы (2022/2023 уч. год)
- Text mining: Advanced Level (Магистратура; где читается: Санкт-Петербургская школа социальных наук; 2-й курс, 1 модуль)Анг
- Machine Learning (Бакалавриат; где читается: Санкт-Петербургская школа социальных наук; 4-й курс, 1, 2 модуль)Анг
- Machine Learning (Бакалавриат; где читается: Санкт-Петербургская школа социальных наук; 3-й курс, 1, 2 модуль)Анг
- Обработка естественного языка (Бакалавриат; где читается: Санкт-Петербургская школа физико-математических и компьютерных наук; 4-й курс, 3 модуль)рус
- Обработка естественного языка (Маго-лего; 3 модуль)рус
- Обработка естественного языка (Магистратура; где читается: Санкт-Петербургская школа физико-математических и компьютерных наук; 1-й курс, 3 модуль)рус
Учебные курсы (2021/2022 уч. год)
- Machine Learning (Магистратура; где читается: Санкт-Петербургская школа социальных наук; 2-й курс, 1 модуль)Анг
- Технологии анализа больших данных (Бакалавриат; где читается: Санкт-Петербургская школа социальных наук; 2-й курс, 1, 2 модуль)рус
Учебные курсы (2020/2021 уч. год)
- Machine Learning (Магистратура; где читается: Санкт-Петербургская школа социальных наук; 2-й курс, 1 модуль)Анг
- Технологии анализа больших данных (Бакалавриат; где читается: Санкт-Петербургская школа социальных наук; 2-й курс, 3 модуль)рус
Гранты
1. Распространение социально-политических новостей в русскоязычной онлайновой социальной сети, РФФИ №18-011-00997, 2018-2020г. Руководитель проекта.
2. Организация международной конференции по социальной информатике SocInfo18. РФФИ № 18-011-20067, Руководитель проекта.
3. Разработка общедоступной базы данных и краудсорсингового веб-ресурса для создания инструментов сентимент-анализа, РГНФ, 2014 год, номер заявки 14-04-12031. Руководитель проекта.
4. Разработка концепции и методологии многоуровневого мониторинга состояния межнациональных отношений по данным социальных сетей. РНФ, 2015 год, номер заявки 15-18-00091. Исполнитель.
5. Проведение летней школы по информационному поиску Russir 2015, РФФИ, 15-37-10308, Руководитель проекта.
Конференции
- 2018
The 10th International Conference on Social Informatics (Socinfo2018) (Saint Petersburg). Доклад: A full-cycle methodology for news topic modeling and user feedback research
- 2016
8th ACM Conference on Web Science (Ганновер). Доклад: Stable Topic Modeling for Web Science: Granulated LDA
66th ICA Annual Conference (Fukuoka). Доклад: Topic Modeling in Online Communication Research: New Possibilities and Challenges
INSCI 2016 - Openness, Collaboration and Collective Action (Florence). Доклад: Stable Topic Modeling with Local Density Regularization
- 2015
XVIII Объединенная конференция "Интернет и современное общество" (IMS - 2015) (Санкт-Петерубург). Доклад: Linis-crowd.org: лексический ресурс для анализа тональности социально-политических текстов на русском языке
International Conference on Computational Social Science (Helsinki). Доклад: Topic Modeling Stability and Granulated LDA
СЕДЬМОЙ СЪЕЗД ВМСО (VI ВСЕРОССИЙСКАЯ КОНФЕРЕНЦИЯ С МЕЖДУНАРОДНЫМ УЧАСТИЕМ «МАСС-СПЕКТРОМЕТРИЯ И ЕЕ ПРИКЛАДНЫЕ ПРОБЛЕМЫ»). Доклад: Applicability of a large particles model for simulation of gas flow in a wide pressure interval.
СЕДЬМОЙ СЪЕЗД ВМСО (VI ВСЕРОССИЙСКАЯ КОНФЕРЕНЦИЯ С МЕЖДУНАРОДНЫМ УЧАСТИЕМ «МАСС-СПЕКТРОМЕТРИЯ И ЕЕ ПРИКЛАДНЫЕ ПРОБЛЕМЫ»). Доклад: Application of Volume Ray Casting technology for 3D visualization of gas dynamics simulation based on the Large Particle Model.
- 2014
The ACM Web Science 2014 Conference (Bloomington). Доклад: Koltsov S., Koltsova O., Nikolenko S. I. Latent Dirichlet Allocation: Stability and Applications to Studies of User-Generated content
1. Social Informatics 2018, St. Petersburg,, Russian Federation A full-cycle methodology for news topic modeling and user feedback research, Sergei Koltsov, Sergei Pashakhin and Sofia Dokuka,
2. SOCIAL NETWORK ANALYSIS 2018,Echo chambers vs opinion crossroads in news consumption on social media, Sofia Dokuka, Sergei Koltcov, Olessia Koltsova and Maxim Koltsov
3. Social Informatics 2017, Oxford, England, When Internet Really Connects Across Space: Communities of Software Developers in Vkontakte Social Networking Site
4. Шестой съезд ВМСО, V Всероссийская конференция с международным участием
«Масс - Спектрометрия и ее прикладные проблемы » 08–11 октября 2013 года, г. Москва
Кольцов С.Н. D. Manure Модель тестовых частиц для численного моделирования в масс – спектрометрии.
Диссертация на соискание учёной степени доктора наук
- 2023
Кольцов С. Н. Энтропийные тематические модели и методы их агрегирования
Научный руководитель диссертационных исследований
- 1Сурков А. Ю. Оптимизация алгоритмов машинного обучения с помощью параметризованных функций (aспирантура: 2-й год обучения)
Опыт работы
2012 - наст. вр. Заместитель руководителя Лаборатории Интернет исследований, Высшая Школа Экономики, Доцент, Департамент прикладной математики и бизнес-информатики (НИУ ВШЭ в Санкт-Петербурге).
Доцент: Н ИУ ВШЭ в Санкт-Петербурге / Санкт-Петербургская школа экономики и менеджмента / Департамент прикладной математики и бизнес-информатики
2010 - 2014. Генеральный директор компании Колтран-Лабс.
2009-2010. Технический директор в компании RBTM-Labs
2008 – 2010. Координатор международного проекта с российской стороны для Forshung Centrum, Karlruhe, Германия.
2008 – 2009. Начальник сектора внедрения компании «ТопПлан»
2006 – 2007. Руководитель проектов сектора внедрения компании «ТопПлан»
2002 - 2006. Научный сотрудник лаборатории экологической масс-спектрометрии, Институт Аналитического Приборостроения РАН.
Руководитель Российско-Немецкого проекта (Институт Аналитического приборостроения РАН и Max Plank Institute fur festkorperforshung, Stuttgart, Germany.
1999-2002. Младший научный сотрудник, научный сотрудник лаборатории электронной спектроскопии, Институт Аналитического Приборостроения РАН.
Информация*
- Общий стаж: 29 лет
Участие в исследовательских проектах, гранты
Руководитель проекта
Разработка общедоступной базы данных и краудсорсингового веб-ресурса для создания инструментов сентимент-анализа
Основной конкурс РГНФ 2014 года
Тематика данного проекта лежит в области сентимент-анализа для задач общественных наук. Проект направлен на создание программного обеспечения (ПО), словаря и базы данных, дающих возможность в дальнейшем разработать методику автоматического определения «эмоциональной заряженности» пользовательского интернет-контента. В сочетании с автоматическим извлечением тем из таких текстов это позволит социальным исследователям определять общественное мнение – точнее, отношение интернет-активной части населения к разным социально значимым вопросам. Важность изучения мнения интернет-общественности подтверждается, среди прочего, высокой ролью социальных сетей и блогов в прокатившейся по миру волне протестов и революций 2011-2013 годов. Автоматическое извлечение тональности из огромных массивов текстов невозможно без специального ПО, тестовых коллекций текстов для проверки такого ПО и - в нашем случае – без словаря тональной лексики.
РАЗРАБОТКА КОНЦЕПЦИИ И МЕТОДОЛОГИИ МНОГОУРОВНЕГО МОНИТОРИНГА СОСТОЯНИЯ МЕЖНАЦИОНАЛЬНЫХ ОТНОШЕНИЙ ПО ДАННЫМ СОЦИАЛЬНЫХ СЕТЕЙ (2015-2017) (РНФ)
Задача проекта «Разработка концепции и методологии многоуровневого мониторинга состояния межнациональных отношений по данным социальных сетей» - дать государственным органам, общественным и исследовательским организациям протестированную методику и удобный инструмент для мониторинга обсуждения вопросов этничности и национальности пользователями интернета. Конечным результатом проекта должны стать методические рекомендации и программное обеспечение для анализа текстовых данных из социальных сетей. Основой метода мониторинга является тематическое моделирование – группа алгоритмов, анализирующих совместную встречаемость слов и на основании этого выявляющих скрытые темы в больших, не поддающихся чтению коллекциях текстов. Итогом работы алгоритма являются вероятности принадлежности текстов к темам и слов к темам, что дает пользователю представление о тематической структуре коллекции и вычленяет тексты, лучше всего репрезентирующие темы. Этот подход совмещается с автоматическим анализом тональности текстов, а также с визуализацией распределений тем, посвященных этничности, по регионам и по временным промежуткам. Таким образом, аналитик получает наглядное представление о том, где, когда, с какой полярностью (негативной или позитивной) и в каком конкретном контексте обсуждаются те или иные этнические группы.
«Можно что-то сделать? Или меня отчислят?»: ИИ-помощники в образовании
Искусственный интеллект может значительно облегчить жизнь студентов и преподавателей университетов. Например, он способен автоматизировать некоторые учебные процессы, а также составить прогноз возможностей трудоустройства выпускников.
Исследователи Центра языка и мозга НИУ ВШЭ представили новые цифровые инструменты для оценки когнитивных функций
В Центре языка и мозга НИУ ВШЭ — Санкт-Петербург, входящем в Институт психологии здоровья, прошел объединенный научный семинар стратегического проекта «Устойчивый мозг». Исследователи представили цифровые инструменты для оценки и коррекции речевых и когнитивных расстройств, в том числе с использованием технологий искусственного интеллекта.
Researchers at HSE in St Petersburg Develop Superior Machine Learning Model for Determining Text Topics
Topic models are machine learning algorithms designed to analyse large text collections based on their topics. Scientists at HSE Campus in St Petersburg compared five topic models to determine which ones performed better. Two models, including GLDAW developed by the Laboratory for Social and Cognitive Informatics at HSE Campus in St Petersburg, made the lowest number of errors. The paper has been published in PeerJ Computer Science.
В Питерской Вышке создадут образовательный ИИ-помощник для студентов
Школа физико-математических и компьютерных наук выиграла в Конкурсе компетенций НИУ ВШЭ. Благодаря этому в Питерской Вышке будет сформирована проектная команда для научных исследований и разработок в области ИИ и машинного обучения. В коллектив войдут эксперты факультета, а также специалисты из ведущих IT-корпораций и научных институтов России. Они создадут рекомендательную систему на основе больших языковых моделей, которая поможет студентам в построении персональной образовательной траектории.
С. Н. Кольцов занял должность профессора НИУ ВШЭ
Ведущий научный сотрудник СКИЛа прошел конкурс на профессорскую должность Департамента информатики Санкт-Петербургской школы физико-математических и компьютерных наук.
Как жила Питерская Вышка в 2023 году
Год постепенно подходит к концу — самое время подвести итоги и поблагодарить друг друга за совместную работу. О самых ярких и важных событиях, которые произошли в Питерской Вышке за этот год, рассказывают преподаватели, академические руководители и деканы факультетов кампуса. Поздравляем с Новым годом, желаем вдохновения и сил на новые свершения!
Научный проект С.Н. Кольцова победил в конкурсе РНФ!
Поздравляем научных сотрудников Лаборатории социальной и когнитивной информатики с победой в конкурсе РНФ! Научный проект под руководством доктора физико-математических наук С.Н. Кольцова получил поддержку на изучение использования больших языковых моделей для решения дифференциальных уравнений.
Пять проектов из Питерской Вышки выиграли грант РНФ
Российский научный фонд подвел итоги конкурса на поддержку проектов малых отдельных научных групп. В число победителей вошли инициативы пяти ученых НИУ ВШЭ — Санкт-Петербург.
СКИЛа выиграла грант РФН на изучение использования больших языковых моделей для решения дифференциальных уравнений
28 ноября 2023 года подведены итоги конкурса Российского научного фонда: заявка Лаборатории социальной и когнитивной информатики получила поддержку на 2024 год.
Сергей Кольцов выступил на семинаре в университете Сириус
20-24 ноября 2023 года в университете Сириус прошел семинар "Математическое моделирование материлов: современные исследования и подготовка кадров". 21 ноября на мероириятии выступил ведущий научный сотрудник Лаборатории социальной и когнитивной информатики С. Н. Кольцов.
Первая встреча с профессией: как прошел «Один день с Питерской Вышкой»
В воскресенье 29 октября корпус на Кантемировской превратился в город будущего с экологичным такси, рестораном с роботами и с социальной сетью для горожан. А все благодаря проектам 252 школьников, которые они создали на лекциях и мастер-классах. Своим опытом с ребятами поделились студенты кампуса, которые помогли им попробовать разные профессии. Кто-то примерил на себя роль UI-дизайнера и сверстал сайт ресторана, а кто-то подготовил трудовой договор для программистов социальной сети. Чем еще запомнится «Один день с Питерской Вышкой» — в нашем репортаже.
В Питерской Вышке прошел летний митап VK Education talks и НИУ ВШЭ
В Питерской Вышке состоялся летний митап Инженерно-математической школы (ИМШ) VK и НИУ ВШЭ для студентов технических направлений. Участники VK Education talks и НИУ ВШЭ смогли узнать о перспективных IT-технологиях и проектах, над которыми работают эксперты VK, научные сотрудники вуза и студенты ИМШ.
Проект из Питерской Вышки о когнитивных искажениях и здоровье выиграл грант РНФ
Российский научный фонд подвел итоги конкурса групповых исследований под руководством молодых ученых. Грант на три года выиграл проект под руководством Елены Артеменко из Лаборатории социальной и когнитивной информатики. Исследование посвящено тому, как когнитивные искажения влияют на восприятие информации, связанной со здоровьем.
Опубликованы результаты совместного проекта СКИЛА и ВТБ
В журнале PeerJComputerScience (IF = 2.41) опубликована статья с результатами совместного проекта лаборатории СКИЛА и Банка ВТБ.
В Санкт-Петербурге научились предсказывать курс акций на неделю вперёд по новостям в СМИ
Теперь «Коммерсантъ», «Ведомости» и РИА «Новости» действительно начнут приносить вам деньги
Защита докторской диссертации Сергея Николаевича Кольцова
01 февраля состоялась защита диссертации Кольцова Сергея Николаевича на тему: «Энтропийные тематические модели и методы их агрегирования».
Поздравляем коллегу: Сергей Николаевич Кольцов успешно защитил докторскую диссертацию
Состоялась защита докторской диссертации Сергея Николаевича Кольцова
Поздравляем коллег с публикацией статьи в PeerJ Computer Science
Сергей Кольцов, Вера Игнатенко, Максим Терпиловский и Паоло Россо опубликовали статью "Analysis and tuning of hierarchical topic models based on Renyi entropy approach" в журнале PeerJ Computer Science.
Работа в СКИЛа глазами стажера-исследователя Анны Мороз
Междисциплинарные исследования Интернета, анализ данных и машинное обучение - основные направления, в рамках которых работает Международная лаборатория социальной и когнитивной информатики (сокращенно СКИЛа).
Семинар Лаборатории машинного интеллекта МФТИ «Вызовы тематического моделирования»
6 декабря на семинаре по AI, организованном Лабораторией машинного интеллекта МФТИ (Москва), состоялось масштабное обсуждение тематического моделирования, в котором принял участие заместитель заведующего ЛИНИС Сергей Кольцов.
День науки с Высшей школой экономики для победителей предметных олимпиад школьников
23 апреля в гимназии № 587 Фрунзенского района Санкт-Петербурга, партнере Высшей школы экономики в Санкт-Петербурге, в третий раз прошел День науки.
ЛИНИС на конференции "International Conference on Computer Simulation in Physics and beyond"
Младший научный сотрудник ЛИНИС Вера Игнатенко приняла участие в международной конференции International Conference on Computer Simulation in Physics and beyond (CSP2018), которая прошла 24 - 27 сентября 2018 в Москве.
Суперинтенсив для будущих магистрантов!
Как анализировать молодежные культуры, музыку, кино, счастье и интернет-данные? Об этом и не только узнали абитуриенты магистерской программы “Современный социальный анализ” на “Зимней школе-2018”.
В ЛИНИС изучат как распространяется информации в социальных сетях
Сотрудниками Лаборатории интернет исследований выигран грант РФФИ 2018 года, тема проекта "Распространение социально-политических новостей в русскоязычной онлайновой социальной сети".
Приглашаем на семинар в Школе Анализа Данных Яндекса
4 октября состоится семинар, организованный московскими коллегами из Школы Анализа Данных Яндекса, на котором представит свой доклад сотрудник ЛИНИС Сергей Кольцов. Мероприятие будет посвящено обсуждению разных подходов к проблеме определения числа тем в тематических моделях.
Всем Data Science!
Сотрудник ЛИНИС Сергей Кольцов принял участие в интенсиве, который прошел 14 и 15 июня в Московском офисе Яндекса.
Поздравляем коллегу с публикацией!
Журнал "Письма в журнал технической физики" (ПЖТФ) принял к публикации статью Сергея Кольцова «Термодинамический подход к проблеме определения числа кластеров на основе тематического моделирования».
Web Science-2017 в Санкт-Петербурге!
Поздравляем коллег с победой в конкурсе на проведение Летней Школы WSTNet Web science Summer School!
Открытость, Сотрудничество и Коллективное действие!
Под таким девизом прошла уже 3-я Международная конференция Internet Science-2016, в которой приняли участие сотрудники ЛИНИС. 12-14 сентября во Флоренции ученые, практики и политики со всего мира объединились, чтобы обсудить социально значимые проблемы и их решения.
ISMW FRUCT-2016
В период с 28 августа по 4 сентября в стенах Высшей Школы Менеджмента (СПбГУ) проходила International FRUCT conference on Intelligence, Social Media and Web (ISMW). Сотрудники Лаборатории Сергей и Олеся Кольцовы выступали в качестве экспертов для проведения мастер-классов по тематическому моделированию.
LINIS Found the Limitations of Text Clustering on the Internet
Sergey Koltsov, Deputy Director of the Laboratory for Internet Studies (LINIS), presented his project on the problems of topic modeling of on-line texts at the Web Science conference in Bloomington.
38,3%
постов в ЖЖ затрагивают социально-политические темы.