Современные задачи инференса моделей требуют меньших ресурсов по сравнению с обучением, что делает использование GPU под инференс нерациональным. Настройка инфраструктуры для работы с видеокартами — сложная задача, которая включает установку и конфигурацию драйверов, управление ресурсами и обеспечение их эффективного использования. GPU оператор позволяет упростить эти моменты, обеспечивая удобную настройку нод для работы с видеокартами и эффективный шеринг GPU.
Кейсы, которые мы рассмотрим в докладе:
- Параллельное обучение моделей несколькими разработчиками на одной видеокарте
- Инференс с множественными репликами на одной видеокарте
- Настройка драйверов видеокарт на разных нодах с использованием GPU оператора