Fork me on GitHub

Июнь 24–25

PyCon Russia 2019

Рус Eng

Артем Королев, Тимур Кадыров, Dentsu Aegis Russia

Создание индустриальных датасетов для задач глубокого обучения

Мы бы хотели, используя Python, поговорить про тему, которую обычно не посмотришь на Coursera в курсе по deep learning и не прочитаешь на Medium в блоге по data science:

— откуда берутся картинки для разметки датасета

— стоит ли их размечать своими руками или сразу отдать подрядчикам и на биржу

— сколько нужно дней, чтобы собрать, удовлетворяющий требованиям заказчика, датасет

— как ставить ТЗ на разметку

— почему некоторые картинки вроде бы относящиеся к нужному классу на самом деле лучше не отправлять в train датасет

— а нужно ли брать картинку, если нужного объекта на ней очень мало

— нужно ли всегда ждать полного обучения нейронной сети или обучать ее итерационно

— и т.д и т.п.

Доклад рассчитан на тех людей, которые думают, что deep learning — это удел больших компаний с big data и огромными отделами data science. Мы расскажем, как подступиться к распознаванию картинок с нуля и вернуться к клиенту с результатом через пару недель, не используя vision API - Google, AWS или Azure.