OSA: инструмент для повышения воспроизводимости и качества научного кода
Тезисы
В современной науке код приходится писать всем: от биологов до химиков. Они зачастую не знакомы с best practices разработки, такой код сложно прочесть и ещё сложнее запустить.

Я расскажу, как обстоят дела в ресёрче (ML и не только). Поговорим о кризисе воспроизводимости, коде к статьям и почему на него больно смотреть. Также расскажу об открытом проекте Open Source Advisor (OSA), который мы делаем в ИТМО. OSA и ридми сгенерирует, и докстринги допишет, и рекомендации даст, и даже всё в Pull Request оформит — останется только поправить детали. А учёные-разработчики, избавившись от страха чистого листа, получат красивый репозиторий с удобным кодом.

После поделюсь опытом технической реализации. Расскажу про внутренности OSA: агентную логику, стратегии промптинга для генерации качественных ридми и документации — и про необычные запросы от научных групп.

Доклад будет полезен исследователям, которые пишут код для научных проектов, но не имеют бэкграунда в разработке, а также разработчикам, поддерживающим такие команды. Он также заинтересует специалистов, работающих с LLM и автоматизацией, и всех, кто сталкивается с проблемами воспроизводимости в научных репозиториях.
В современной науке код приходится писать всем: от биологов до химиков. Они зачастую не знакомы с best practices разработки, такой код сложно прочесть и ещё сложнее запустить.

Я расскажу, как обстоят дела в ресёрче (ML и не только). Поговорим о кризисе воспроизводимости, коде к статьям и почему на него больно смотреть. Также расскажу об открытом проекте Open Source Advisor (OSA), который мы делаем в ИТМО. OSA и ридми сгенерирует, и докстринги допишет, и рекомендации даст, и даже всё в Pull Request оформит — останется только поправить детали. А учёные-разработчики, избавившись от страха чистого листа, получат красивый репозиторий с удобным кодом.

После поделюсь опытом технической реализации. Расскажу про внутренности OSA: агентную логику, стратегии промптинга для генерации качественных ридми и документации — и про необычные запросы от научных групп.

Доклад будет полезен исследователям, которые пишут код для научных проектов, но не имеют бэкграунда в разработке, а также разработчикам, поддерживающим такие команды. Он также заинтересует специалистов, работающих с LLM и автоматизацией, и всех, кто сталкивается с проблемами воспроизводимости в научных репозиториях.
Видеозапись доклада
Появится здесь после конференции
Информация о спикере
Андрей Гетманов
ML инженер, Университет ИТМО
Санкт-Петербург
Работаю в Исследовательском центре "Сильный ИИ в промышленности" ИТМО. Начинал с исследования AutoML, сейчас занимаюсь LLM и мультиагентными системами.

Энтузиаст открытого кода, активист движения ITMO.OpenSource.

В свободное время люблю пить китайский чай, коллекционирую кассетную музыку.
  • Андрей Гетманов
    ML инженер, Университет ИТМО
    Санкт-Петербург
    Работаю в Исследовательском центре "Сильный ИИ в промышленности" ИТМО. Начинал с исследования AutoML, сейчас занимаюсь LLM и мультиагентными системами.

    Энтузиаст открытого кода, активист движения ITMO.OpenSource.

    В свободное время люблю пить китайский чай, коллекционирую кассетную музыку.
Все доклады трека