В современной науке код приходится писать всем: от биологов до химиков. Они зачастую не знакомы с best practices разработки, такой код сложно прочесть и ещё сложнее запустить.
Я расскажу, как обстоят дела в ресёрче (ML и не только). Поговорим о кризисе воспроизводимости, коде к статьям и почему на него больно смотреть. Также расскажу об открытом проекте Open Source Advisor (OSA), который мы делаем в ИТМО. OSA и ридми сгенерирует, и докстринги допишет, и рекомендации даст, и даже всё в Pull Request оформит — останется только поправить детали. А учёные-разработчики, избавившись от страха чистого листа, получат красивый репозиторий с удобным кодом.
После поделюсь опытом технической реализации. Расскажу про внутренности OSA: агентную логику, стратегии промптинга для генерации качественных ридми и документации — и про необычные запросы от научных групп.
Доклад будет полезен исследователям, которые пишут код для научных проектов, но не имеют бэкграунда в разработке, а также разработчикам, поддерживающим такие команды. Он также заинтересует специалистов, работающих с LLM и автоматизацией, и всех, кто сталкивается с проблемами воспроизводимости в научных репозиториях.