Данные — топливо машинного обучения. Когда этого топлива не хватает, инженеры используют разные трюки, чтобы это топливо обогатить. Аугментация — один из таких трюков, когда мы изменяем исходные данные с помощью простых и не очень процедур.
Иногда процедуры выстраиваются в конвейер. Часто отдельные процедуры имеют пару настроек, определяющие степень изменчивости данных.
Кто-то может спросить, а какие настройки выставить и как выбрать последовательность, чтобы эффект был максимальным? В докладе расскажем, как оптимизация гиперпараметров помогла найти ответ на вопрос. Мы покажем, что от стратегии аугментации зависит, пойдёт ли качество классификатора вверх или вниз, поэтому очень важно найти её оптимальный вариант.