Fork me on GitHub

Июнь 24–25

PyCon Russia 2019

Рус Eng

Станислав Кириллов, CatBoost

CatBoost и Python: как быстро учить и применять CatBoost модели в Python приложениях

Градиентный бустинг на решающих деревьях является базовым инструментом решения множества практических задач. Очень часто обучать и применять модели необходимо именно на питоне, в том числе в продакшне. Если разобраться с тем, как происходит работа со входными данными у библиотек градиентного бустинга, то обучение и применение можно делать эффективно, без лишних преобразований данных.

Я поделюсь опытом написания Cython обертки для C++ кода на примере библиотеки CatBoost и расскажу о том, как эффективно передавать данные из Python в С++. Поделюсь рецептами эффективного использования CatBoost в python коде, позволяющими учить модели быстро и избегать перерасхода памяти и лишних преобразований данных.