Александр Никулин. Первая open-source библиотека для Offline RL исследователей

Первая open-source библиотека для Offline RL исследователей

Тезисы

Хотели понять, как устроены популярные Offline RL алгоритмы, но не смогли найти понятных и доступных имплементаций, с которыми легко экспериментировать? Мы тоже! Поэтому в Tinkoff AI решили написать свою собственную open-source библиотеку CORL со всеми популярными Offline RL алгоритмами в доступной форме — на каждый алгоритм по одному файлу и с минимумом зависимостей.

В докладе расскажу подробнее о том, почему решили писать своё с нуля, что из этого вышло и как это повлияло на наши новые исследования в Offline RL.

Доклад рассчитан на тех, кому интересен Offline RL, кому интересно узнать об опыте open-source проектов и о том, как устроен процесс исследований в Tinkoff AI. Слушатели поймут, чем исследования в RL отличаются от применения на практике и почему для этого могут потребоваться библиотеки с разной философией.

Видеозапись доклада

Появится здесь после конференции

Информация о спикере

Александр Никулин

Младший исследователь-программист, Тинькофф

https://github.com/Howuhh
https://howuhh.github.io

Александр Никулин

Младший исследователь-программист, Тинькофф

https://github.com/Howuhh
https://howuhh.github.io

Все доклады трека