Pandas. Как писать читаемый код
Тезисы
Добавить колонку в pandas? Получи мусор в области видимости.
df1 = df.loc[df.col == "что-то"], потом работаешь с df1, итог — SettingWithCopyWarning, а по ноутбуку уже валяются df1, df2, tmp, tmp_final, df_final.
Всё ради того, чтобы просто посчитать одно новое поле!

А можно по-другому.
Поговорим про декларативный стиль: assign, pipe, loc, agg — и при чём тут lambda.
Как собрать из этого читаемые цепочки — без промежуточных df1, без побочных эффектов и без говнокода.
Добавить колонку в pandas? Получи мусор в области видимости.
df1 = df.loc[df.col == "что-то"], потом работаешь с df1, итог — SettingWithCopyWarning, а по ноутбуку уже валяются df1, df2, tmp, tmp_final, df_final.
Всё ради того, чтобы просто посчитать одно новое поле!

А можно по-другому.
Поговорим про декларативный стиль: assign, pipe, loc, agg — и при чём тут lambda.
Как собрать из этого читаемые цепочки — без промежуточных df1, без побочных эффектов и без говнокода.
Видеозапись доклада
Появится здесь после конференции
Информация о спикере
Денис Катаев
Разработчик, Т-Банк
Екатеринбург
  • Денис Катаев
    Разработчик, Т-Банк
    Екатеринбург
Все доклады трека