В Sbercloud MLSpace мы даем возможность запускать распределенные задачи обучения, jupyter notebooks, inferences и деплоить любые docker образы с автомасштабированием. Все это работает в kubernetes.
В своем докладе я расскажу, как мы пишем сервисы, которые управляют ресурсами. Поведаю, как мы отслеживаем состояния запущенных задач. Также расскажу, как у нас устроена работа с мультикластерностью.
Доклад рассчитан на разработчиков, которые используют kubernetes или собираются строить внутреннюю инфраструктуру для запуска большого количества задач, простого развертывания сервисов. Слушатели узнают, что kubernetes не такой страшный и что можно не бояться с ним работать через python.