Аналитик данных (data scientist)
занимается обработкой и анализом больших массивов данных, с помощью методов статистического анализа и математических моделей находит скрытые закономерности и разрабатывает прогнозы в целях решения задач бизнеса и науки
Data science — на сегодняшний день, это, наверное, самая востребованная и специальность в мире. Еще в 2015 году среди студентов Массачусетского технологического института насчитывалось всего-навсего 50 человек слушателей курса «Машинное обучение», то в 2017 году на этот курс записалось 720 студентов
Герман Греф, президент, председатель правления «ПАО Сбербанк» (Источник)
В связи с цифровизацией почти всех сфер деятельности человека, накоплением огромных массивов данных и ростом вычислительных мощностей профессия аналитика данных (data scientist) еще в 2012 г. была названа «самой привлекательной в XXI веке» . Data scientist — междисциплинарная специальность, предполагающая наличие глубоких знаний математики, статистики и теории вероятностей, навыков программирования и требующая понимания специфики соответствующего научного направления либо бизнес-задач. Он разрабатывает методологию сбора, обработки и анализа неструктурированных больших данных (текст, графика, речь) и способен находить в них неочевидные закономерности, позволяющие повышать эффективность принимаемых решений.
Аналитик данных может работать как в сфере науки, так и в компаниях, в государственных и частных организациях. Он зачастую является членом междисциплинарной команды вместе с архитектором данных, инженерами данных, аналитиками предметной области и другими специалистами.
Драйверы профессии
- Стремительный рост объемов данных
- Цифровая трансформация экономики
- Развитие концепции открытых данных
- Стремление организаций снижать расходы за счет автоматизации производственных и управленческих процессов
Задачи, которые решает специалист
- Разработка методологии сбора и хранения больших массивов разнородных типов данных (количественных, текстовых, графических)
- Анализ данных с помощью методов математической статистики и моделирования
- Превращение «инсайтов» (выявленных закономерностей) в конкретные эффективные решения для бизнеса, науки, общества
Необходимые компетенции
- Знание математической статистики и теории вероятностей
- Владение технологиями машинного обучения и его приложениями (обработка естественного языка, обучение с подкреплением, рекомендательные системы, распознавание образов)
- Навыки программирования и работы с базами данных, владение специализированными программными пакетами для анализа данных
- Умение структурировать и интегрировать разнородные источники данных
- Навыки презентации и визуализации полученных результатов
Магистерские программы
Цифры и факты
Источники: