Игорь Буянов. Настройка аугментаций для текстов как оптимизация гиперпараметров

Настройка аугментаций для текстов как оптимизация гиперпараметров

Тезисы

Данные — топливо машинного обучения. Когда этого топлива не хватает, инженеры используют разные трюки, чтобы это топливо обогатить. Аугментация — один из таких трюков, когда мы изменяем исходные данные с помощью простых и не очень процедур.

Иногда процедуры выстраиваются в конвейер. Часто отдельные процедуры имеют пару настроек, определяющие степень изменчивости данных.

Кто-то может спросить, а какие настройки выставить и как выбрать последовательность, чтобы эффект был максимальным? В докладе расскажем, как оптимизация гиперпараметров помогла найти ответ на вопрос. Мы покажем, что от стратегии аугментации зависит, пойдёт ли качество классификатора вверх или вниз, поэтому очень важно найти её оптимальный вариант.

Видеозапись доклада

Появится здесь после конференции

Информация о спикере

Игорь Буянов

Старший разработчик, MTS AI

Работаю NLP-инженером 5 лет https://www.linkedin.com/in/igor-buyanov/
Аспирант в ФИЦ ИУ РАН
Веду блог в Телеграме https://t.me/yet_another_nlp_notes
Пишу на Хабре https://habr.com/ru/users/aarmaageedoon/publications/articles/

Игорь Буянов

Старший разработчик, MTS AI
- Работаю NLP-инженером 5 лет https://www.linkedin.com/in/igor-buyanov/
- Аспирант в ФИЦ ИУ РАН
- Веду блог в Телеграме https://t.me/yet_another_nlp_notes
- Пишу на Хабре https://habr.com/ru/users/aarmaageedoon/publications/articles/

Все доклады трека