• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Магистерская программа «Аналитика данных и прикладная статистика / Data Analytics and Social Statistics»

Прикладная статистика и науки о данных

На рынке труда сейчас существует множество вакансий в сфере наук о данных. С экспоненциальным ростом объема информации специалисты в области анализа данных становятся незаменимыми для компаний всех отраслей. В грядущие годы сфера наук о данных получит динамичное развитие, и поиск интересных проектов и работы станет конкурентным, а работодатели – более требовательными к компетенциям претендентов. 

Основой современного анализа данных является прикладная статистика. Прикладная статистика позволяет применять продвинутые методы математической статистики и обрабатывать статистические данные для анализа различных сфер жизни общества с помощью компьютерной обработки данных. Технические знания и навыки, которые усиливают это направление, дают Науки о данных, или Data Science, как область, которая объединяет разделы компьютерных наук, связанных с данными: сбором, обработкой, анализом и принятием эффективных решений. Объединение двух направлений позволяет проводить анализ больших объемов неструктурированных данных – той комплексной информации о современном обществе, которая становится доступна исследователю благодаря новым информационным технологиям. Именно поэтому наш трек называется «Прикладная статистика и науки о данных»

«More than anything, what data scientists do is make discoveries while swimming in data. It’s their preferred method of navigating the world around them. At ease in the digital realm, they are able to bring structure to large quantities of formless data and make analysis possible. They identify rich data sources, join them with other, potentially incomplete data sources, and clean the resulting set. In a competitive landscape where challenges keep changing and data never stops flowing, data scientists help decision-makers shift from ad hoc analysis to an ongoing conversation with data.

What kind of person does all this? What abilities make a data scientist successful? Think of him or her as a hybrid of data hacker, analyst, communicator, and trusted adviser. The combination is extremely powerful—and rare.

If “sexy” means having rare qualities that are much in demand, data scientists are already there. They are difficult and expensive to hire and, given the very competitive market for their services, difficult to retain. There simply aren’t a lot of people with their combination of scientific background and computational and analytical skills».

Davenport Thomas H., Patil DJ Data Scientist: The Sexiest Job of the 21st Century. Meet the people who can coax treasure out of messy, unstructured data // Harvard Business Review — October, 2012.  
Специалисты, работающие с данными, находятся в постоянном поиске новых решений и гипотез для бизнеса. От аналитиков данных требуется не только навыки системного представления данных, но и творческий подход к визуальному отображению информации, желание и готовность заглянуть вглубь проблемы, найти вопросы, лежащие в ее основе, и сформулировать их в доступный проверке набор гипотез. Важно помнить, что анализ данных — это в первую очередь про исследования. Исследовать данные можно на разных уровнях: автоматизировать процесс анализа, формулировать множество гипотез и тестировать их с помощью различных методов. Аналитики данных в современном бизнесе помогают анализировать основные метрики, решать операционные задачи и достигать стратегических целей. 

Аналитик данных должен понимать тенденции развития искусственного интеллекта (включая Gen AI), паттерны и стратегии дата-аналитики, а также не только уметь программировать, но и глубоко понимать создаваемый продукт, а также хорошо ориентироваться в статистике. В 2012 году Томас Х. Давенпорт с коллегами опубликовали статью «Data Scientist: Sexiest Job of the 21st Century», а в 2022 – ее продолжение под названием «Is Data Scientist Still the Sexiest Job of the 21st Century?», в котором отмечали, что важно не только уметь строить модели, но и загружать в них нужные данные, а также управлять работой систем, исходя из тех целей, которые ставит бизнес.

У компаний и организаций любого размера в разных отраслях экономики есть запрос на специалистов, которые смогут управлять потоками данных и находить в них ценную информацию. Специалисты этой сферы должны хорошо знать статистику и обладать знаниями в соответствующей предметной области. Знание статистических методов усиливается навыками из компьютерных наук. 

Запрос на специалистов в области анализа данных актуален не только для компаний, но и естественным образом вписан в национальную стратегическую повестку технологического развития (национальные проекты «Экономика данных» и «Искусственный интеллект»). В частности, именно национальный проект «Экономика данных» подтверждает и актуализирует запрос на специалистов в области статистики и анализа данных. Важно иметь возможность планировать развитие экономики отдельных отраслей, регионов и городов, а также эффективно и проактивно выстраивать работу любой организации для максимально быстрого получения результата.
«These developments mean that coding, which was perhaps the single most common job requirement when we wrote a decade ago, is somewhat less essential in data science. It has migrated to other jobs or is being increasingly automated. (Data cleaning is a notable exception to this trend, however.) The key focus of the job continues to shift towards predictive modeling and the ability to translate business issues and requirements into models. These are collaborative activities, but unfortunately there are as yet no great tools for structuring and supporting collaborative data science activities».

Davenport Thomas H., Patil DJ Is Data Scientist Still the Sexiest Job of the 21st Century? // Harvard Business Review – July 15, 2022. 
Основные составляющие для трека «Прикладная статистика и науки о данных» — это обучение работе с данными и изучение продвинутых статистических методов. Важно понимать, как извлекать информацию из разных источников, а также как в дальнейшем работать с этой информацией, получая статистически точные и достоверные результаты, которые можно использовать при принятии решений в бизнесе. Изучение разнообразных продвинутых статистических методов анализа данных (Contemporary Methods of Data Analysis, Bayesian Statistics, Stochastic Models, Time Series, Network Analysis и многих других) и компьютерными методами обработки и анализа данных (Data Mining, Machine Learning, Programming in R and Python, Unstructured Data Analysis и других) будет завершаться выполнением прикладных проектов. Владея современными методами анализа данных, можно решать задачи максимально эффективным путём, обрабатывая массивы данных в программных продуктах, которые требуют различного уровня участия пользователя. Студенты программы познакомятся с программами, пакетами и базами для полного цикла работы с данными: R, Python, SAS, STATA, Orange, Pajek, Gephi, и другие. Студенты научатся работать с алгоритмами, способными получать, обрабатывать данные, просчитывать и принимать решения. Знание математической статистики, навыки проверки гипотез и оценки неизвестных параметров дополняются глубоким пониманием того, как проводятся актуальные исследования в бизнесе, в т. ч. с применением технологий искусственного интеллекта. 

Трек «Прикладная статистика и науки о данных» подойдет студентам, желающим развиваться в области анализа данных – актуального и востребованного направления в любой предметной области. Базовое образование может быть любым: трек будет интересен студентам как с образованием в области социальных наук, так и с образованием в области точных наук. С одной стороны студенты на треке смогут систематизировать и углубить свои знания в области социальных наук, а с другой – освоить навыки  исследования данных, чтобы выполнять задачи дата-аналитики и эффективнее руководить командами аналитиков данных и дата-сайнтистов.

Обучение на этом треке позволит студентам приобрести нужные знания и навыки для трудоустройства в различных компаниях и корпорациях. Выпускники трека «Прикладная статистика и науки о данных» могут работать как аналитики данных или продуктовые аналитики в разных сферах, решая как исследовательские задачи, так и прикладные задачи по управлению продуктами и процессами в рамках своих организаций. При желании выпускники трека смогут продолжить работу и в академической среде, поступив на программы PhD или в аспирантуру.