Аналитик данных (data scientist)

занимается обработкой и анализом больших массивов данных, с помощью методов статистического анализа и математических моделей находит скрытые закономерности и разрабатывает прогнозы в целях решения задач бизнеса и науки

Data science — на сегодняшний день, это, наверное, самая востребованная и специальность в мире. Еще в 2015 году среди студентов Массачусетского технологического института насчитывалось всего-навсего 50 человек слушателей курса «Машинное обучение», то в 2017 году на этот курс записалось 720 студентов

Герман Греф, президент, председатель правления «ПАО Сбербанк» (Источник)

В связи с цифровизацией почти всех сфер деятельности человека, накоплением огромных массивов данных и ростом вычислительных мощностей профессия аналитика данных (data scientist) еще в 2012 г. была названа «самой привлекательной в XXI веке» . Data scientist — междисциплинарная специальность, предполагающая наличие глубоких знаний математики, статистики и теории вероятностей, навыков программирования и требующая понимания специфики соответствующего научного направления либо бизнес-задач. Он разрабатывает методологию сбора, обработки и анализа неструктурированных больших данных (текст, графика, речь) и способен находить в них неочевидные закономерности, позволяющие повышать эффективность принимаемых решений.

Аналитик данных может работать как в сфере науки, так и в компаниях, в государственных и частных организациях. Он зачастую является членом междисциплинарной команды вместе с архитектором данных, инженерами данных, аналитиками предметной области и другими специалистами.

 

Драйверы профессии

  • Стремительный рост объемов данных
  • Цифровая трансформация экономики
  • Развитие концепции открытых данных
  • Стремление организаций снижать расходы за счет автоматизации производственных и управленческих процессов

 


 

Задачи, которые решает специалист

  • Разработка методологии сбора и хранения больших массивов разнородных типов данных (количественных, текстовых, графических)
  • Анализ данных с помощью методов математической статистики и моделирования
  • Превращение «инсайтов» (выявленных закономерностей) в конкретные эффективные решения для бизнеса, науки, общества

Необходимые компетенции

  • Знание математической статистики и теории вероятностей
  • Владение технологиями машинного обучения и его приложениями (обработка естественного языка, обучение с подкреплением, рекомендательные системы, распознавание образов)
  • Навыки программирования и работы с базами данных, владение специализированными программными пакетами для анализа данных
  • Умение структурировать и интегрировать разнородные источники данных
  • Навыки презентации и визуализации полученных результатов

Цифры и факты

Каждые 1,2 года
удваивается мировой объем данных, генерируемых в ходе коммерческой деятельности
Менее 0,5%
общего объема данных, производимых человечеством, в итоге используются в практической деятельности
88%
всех аналитиков данных довольны или очень довольны своей работой

 

ДРУГИЕ ПРОФЕССИИ НАПРАВЛЕНИЯ «ФОРМИРОВАНИЕ НОВОЙ ПАРАДИГМЫ НАУЧНО-ТЕХНОЛОГИЧЕСКОГО РАЗВИТИЯ»