// Что в интенсиве 


👨🏼‍🏫 Machine Learning
// 4 вебинара, посвященных основам работы с текстовыми данными и обучению моделей на текстах


👩🏻‍💻 Практика 
// практические домашние задания после каждого занятия


🏆 Соревнование 
// соревнование по классификации текстов на собранных участниками обучающих данных, проходящее на платформе Kaggle

// О чем

Вы познакомитесь с основами работы с текстом, освоите парсинг и скрапинг данных и базовые подходы к обработке и векторизации текстовых данных. Также вы сможете закрепить полученные знания, выполняя тесты и домашние задания в рамках курса. В конце курса вы сможете поучаствовать в соревновании по анализу текстовых данных.


// Для кого

Буткемп будет интересен тем, кто уже знаком с Python, знает математику в рамках школьной программы и хотел бы познакомиться с подходами к решению задач обработки естественного языка, а также получить навыки работы с текстами и скрапинга данных.

Если вы уже имеете опыт решения задач машинного обучения, то курс вам тоже понравится - вы сможете посоревноваться в решении задачи NLP с другими участниками курса в рамках соревнования на платформе Kaggle.

Начальные требования:

  • знание математики в рамках школьной программы;
  • знание python на пользовательском уровне.
Зарегистрироваться

// Преподаватели 


Кантонистова Елена Олеговна

  • Академический руководитель онлайн-магистратуры "Машинное обучение и высоконагруженные системы"
  • Кандидат физико-математических наук, доцент департамента больших данных и информационного поиска ФКН ВШЭ

Паточенко Евгений Анатольевич

  • Преподаватель курса “Инструменты разработки” в магистратуре “Машинное обучение и высоконагруженные системы” ФКН ВШЭ
  • Инженер с пятнадцатилетним опытом реализации распределённых систем в области алгоритмической торговли на российских и зарубежных рынках

// Программа 


  • 13.12 | 18:00–19:30
    Работа со строками в Python. Регулярные выражения (Евгений Паточенко)

  • 15.12 | 18:00–19:30
    bag of words, tf-idf (Елена Кантонистова)

  • 16.12 | 18:00—19:30
    Скрапинг и парсинг (Евгений Паточенко)

  • 21.12 | 18:00—19:30
    Улучшения: стоп-слова, лемматизация, N-граммы (Елена Кантонистова)

  • 21.12 | 20:00 — 04.01 | 20:00
    Соревнование по анализу текстовых данных на платформе Kaggle

// Ссылки для подключения