// Что в интенсиве
👨🏼🏫 Machine Learning
// 4 вебинара, посвященных основам работы с текстовыми данными и обучению моделей на текстах
👩🏻💻 Практика
// практические домашние задания после каждого занятия
🏆 Соревнование
// соревнование по классификации текстов на собранных участниками обучающих данных, проходящее на платформе Kaggle
// О чем
Вы познакомитесь с основами работы с текстом, освоите парсинг и скрапинг данных и базовые подходы к обработке и векторизации текстовых данных. Также вы сможете закрепить полученные знания, выполняя тесты и домашние задания в рамках курса. В конце курса вы сможете поучаствовать в соревновании по анализу текстовых данных.
// Для кого
Буткемп будет интересен тем, кто уже знаком с Python, знает математику в рамках школьной программы и хотел бы познакомиться с подходами к решению задач обработки естественного языка, а также получить навыки работы с текстами и скрапинга данных.
Если вы уже имеете опыт решения задач машинного обучения, то курс вам тоже понравится - вы сможете посоревноваться в решении задачи NLP с другими участниками курса в рамках соревнования на платформе Kaggle.
Начальные требования:
- знание математики в рамках школьной программы;
- знание python на пользовательском уровне.
// Преподаватели
- Академический руководитель онлайн-магистратуры "Машинное обучение и высоконагруженные системы"
- Кандидат физико-математических наук, доцент департамента больших данных и информационного поиска ФКН ВШЭ
Паточенко Евгений Анатольевич
- Преподаватель курса “Инструменты разработки” в магистратуре “Машинное обучение и высоконагруженные системы” ФКН ВШЭ
- Инженер с пятнадцатилетним опытом реализации распределённых систем в области алгоритмической торговли на российских и зарубежных рынках
// Программа
-
13.12 | 18:00–19:30
Работа со строками в Python. Регулярные выражения (Евгений Паточенко) -
15.12 | 18:00–19:30
bag of words, tf-idf (Елена Кантонистова) -
16.12 | 18:00—19:30
Скрапинг и парсинг (Евгений Паточенко) -
21.12 | 18:00—19:30
Улучшения: стоп-слова, лемматизация, N-граммы (Елена Кантонистова) -
21.12 | 20:00 — 04.01 | 20:00
Соревнование по анализу текстовых данных на платформе Kaggle
// Ссылки для подключения