Запрос счета
Заполните поля ниже, чтобы получить счет на оплату билетов PyCon Russia от юридического лица. Футболки PyCon Russia можно купить в Магазине IT-People
Юр. лицо
ИНН
Количество билетов на конференцию
+
Промокод (если есть)
Программа
10.00 10.40
12.00 12.40
09.00 10.00
12.50 13.30
Мастер-класс
Александр Абрамов
SberDevices
Максим Данилов
wPsoft
Павел Дружинин
Mail.ru Group
ДЕНЬ ПЕРВЫЙ. 5 СЕНТЯБРЯ 2021
ДЕНЬ ВТОРОЙ. 6 СЕНТЯБРЯ 2021
10.50 11.30
Артём Иннокентьев
Evrone
Тимур Кадыров, Артём Королёв
Андрей Ермилов, Максим Белоусов
Avito.tech, Rambler
Олег Ивашов, Сергей Матвеенко
Assaia
Мастер-класс
Александр Абрамов
SberDevices
Перерыв 30 минут
11.30 12.00
Никита Соболев
wemake.services / dry-labs
Антон Киселёв
Provectus
Юлия Волкова
EPAM
Владислав Лаухин
Райффайзен
Мастер-класс
Илья Иваников, Тинькофф
Денис Аникин
Райффайзен
Богдан Володарский
Provectus
Альбина Альмухаметова
Технократия
Антон Палий
Тинькофф
Вячеслав Буторов
Finvinci Volsor s.r.o
Обед
13.30 15.00
15.00 15.40
Алексей Кузьмин
ДомКлик
Ярослав Игошев
Intel
Александр Морозов
Datafold
Мастер-класс
Ярослав Таркан, Александр Демидовский
Intel
15.50 16.30
Анна Богданова
Ostrovok.ru
Иван Санин
Авито
Владислав Мухаматнуров
Тинькофф
Данил Ахтаров
Тинькофф
Мастер-класс
Ярослав Таркан, Александр Демидовский
Intel
Перерыв 30 минут
16.30 17.00
17.00 17.40
Александр Шибаев
Тинькофф
Андрей Алексеев
Тинькофф
Сергей Петров
Selectel
Lighting Talks
18.00 19.00
Ужин
18.30 20.00
Регистрация, завтрак
08.00 10.00
Завтрак
Перерыв 30 минут
11.30 12.00
Обед
13.30 15.00
Lighting Talks
18.00
Ужин
18.30 20.00
10.00 10.40
10.50 11.30
12.00 12.40
12.50 13.30
15.00 15.40
15.50 16.30
Сбер (Лаборатория нейронаук и поведения человека)
17.00 17.40
Завтрак
08.00 10.00
Отъезд
Основной поток
Никита Соболев
wemake.services / dry-labs, Санкт-Петербург
typed-linter: окончательное решение проблемы статического анализа в Python
Тезисы
Павел Дружинин
Mail.ru Group, Москва
Из веб-девелопмента к «железу»: автоматизируем на Python выдачу оборудования при помощи вендоматов в компании с 9000+ сотрудников
Тезисы
Юлия Волкова
EPAM, Санкт-Петербург
Разработка на Python: А можно еще быстрее?
Тезисы
Денис Аникин
Райффайзен, Москва
FastAPI как основной framework для python бэкендов
Тезисы
Сергей Петров
Selectel, Санкт-Петербург
Pyroutines: история о том, как идеи одного языка перетекают в другой
Тезисы
Владислав Мухаматнуров
Тинькофф, Екатеринбург
Автоматизатор в команде питонистов
Тезисы
Александр Шибаев
Тинькофф, Екатеринбург
Внедрение зависимостей, контейнеры и прочие проявления SOLID в питоне. Как жить на большом проекте.
Тезисы
Альбина Альмухаметова
Технократия, Казань
Оптимизация i-запросов в Django+Postgres или неточности документации
Тезисы
Александр Морозов
Datafold, Москва
Семантический поиск по аналитическим данным с помощью Python и Neo4j
Тезисы
Артем Иннокентьев
Evrone, Якутск
Pattern matching: польза или хайп?
Тезисы
Владислав Лаухин
Райффайзен, Москва
Построение мониторинга python-приложений с использованием opentelemetry
Тезисы
Данил Ахтаров
Тинькофф, Санкт-Петербург
Кеширование — делаем всё правильно
Тезисы
Антон Палий
Тинькофф, Екатеринбург
Python и метрики. Мониторинг наше все
Тезисы
Анна Богданова
Ostrovok.ru, Москва
Rефакторинг: Regулярный и ASTообразный
Тезисы
Алексей Кузьмин
ДомКлик, Москва
Обработка ошибок в Python
Тезисы
Вячеслав Буторов
Finvinci Volsor s.r.o, Прага (Чехия)
Как создать ваш собственный плагин для Sentry, при полном отсутствии документации
Тезисы
Максим Данилов
wPsoft, Landeck (Австрия)
Скрытая супер-сила Django Admin Panel в масштабируемом Backend приложении
Тезисы
Олег Ивашов, Сергей Матвеенко
Assaia, Санкт-Петербург
Шина сообщений NSQ в Python — что это, зачем и как
Тезисы
Андрей Ермилов, Максим Белоусов
Avito.tech, Rambler, Москва
Практические советы по использованию опциональной статической типизации
Тезисы
Никита Соболев, wemake.services / dry-labs, Санкт-Петербург
typed-linter: окончательное решение проблемы статического анализа в Python
В статическом анализе в Python творится страшное. Но, почти никто не замечает слона в комнате. Давайте разбираться, что у нас болит.

В докладе я расскажу про проблемы:


  • Качество самих инструментов
  • Внедрение статического анализа в старый проект — почти невозможно
  • Игнорирование ошибок не позволяет сделать «как мне надо», а только как «как просит линтер»
  • Восприятие статического анализа в сообществе: многие уверены, что им достаточно Black!
  • Типизация сейчас является скорее сводным братом троюродной сестры вашей соседки, чем полноценным членом семьи статического анализа
  • Исправление ошибок? Забудьте!
И поделюсь решением: typed-linter — проект, над которым я работаю последние полгода.
Краткий анонс:
  • Новый runtime, сделанный как надо
  • Legacy-first
  • Умное игнорирование ошибок
  • Удобство использования и внедрения
  • Типы (вау!)
  • Исправление большинства ошибок без вашего участия
А также расскажу про модель распространения, которая сочетает в себе open-source и позволяет заниматься проектом на постоянной основе, а не по 10 минут перед сном на выходных.
После моего доклада вы получите +1 крутой инструмент, который сможет решить проблемы в вашем коде.
Юлия Волкова, EPAM, Москва
Разработка на Python: А можно еще быстрее?
Расскажу о том, как экономить время на старте проектов. Посмотрим как тут выручает генерация кода и что есть из готовых решений.
Как можно, просто введя 2 команды из DDL схемы базы данных, получить готовый CRUD REST сервис с моделями и endpoint-ами.
Зачем мне в 2020 пришлось писать свой ddl парсер и генерацию ORM & Pydantic моделей, и как это облегчило жизнь проекту.
Что из чего вообще можно генерировать, чтобы не писать это руками. Бегло посмотрим какие есть готовые библиотеки на сегодняшний день (основные их категории) и кейсы их использования.
Обсудим плюсы данного тренда. Лично мне кажется, что это тренд — с каждым годом таких библиотек все больше и больше, и мы стараемся не писать тот код, который можно не писать. Рассмотрим кейсы, когда это удобно/полезно (про быстрые PoC, RnD) и направления, куда двигаться дальше, если тема интереса.
Павел Дружинин, Mail.ru Group, Москва
Из веб-девелопмента к «железу»: автоматизируем на Python выдачу оборудования при помощи вендинговых аппаратов в компании с 9000+ сотрудников
В корпорациях любят всё автоматизировать. Большое количество энтерпрайз-продуктов и внутренних веб-сервисов, которые общаются между собой — все это привычные задачи внутренней и инфраструктурной разработки.

Но что, если необходимо автоматизировать выдачу оборудования сотруднику компании? Это возможность выйти за рамки стандартных веб-сервисов и узнать что происходит на уровне железа.

Как включить огромную железную коробку, которая умеет только принимать байты на серийный порт, в привычный нам, веб-разработчикам, стек Django, React. js, PostgreSQL, Celery и заставить все это общаться между собой?

Посмотрим на консьюмеры Kombu, RabbitMQ. Поучимся управлять пружинами вендинга при помощи Python, читать оптические датчики. Построим всю систему до пользовательского интерфейса «снизу-вверх». И постараемся по пути не отрезать себе палец, когда будем перекидывать питание крутящих серво-приводов между шинами :)
Сергей Петров, Selectel, Санкт-Петербург
Pyroutines: история о том, как идеи одного языка перетекают в другой
В докладе расскажу:
  • Как еще можно решить проблему с GIL, если не хочется запускать несколько параллельных процессов, а asyncio уже не хватает.
  • Чему многопоточность Python может поучиться у Go?
  • Возможности интерпретатора которые существуют уже давно, но о которых никто не слышал.
Денис Аникин, Райффайзен, Москва
FastAPI как основной framework для python бэкендов

FastAPI уже не первый год с нами.
Последние пару лет фреймворк явно на подъеме: количество звезд на гитхабе уже больше чем 50% от мастодонтов рынка — django, flask. В ds среде и в каждом туториале flask, в каждой второй вакансии суперсовременные горизонтально масштабируемые сервисы на… django.

Однако, про fastapi разговоров довольно немного и проникновение как в рынок, так и в публичное пространство у него не велико. И уж тем более, пока ещё про него не говорили с позиции продакшена (как минимум, на конференциях).

Так сложилось, что в банке мы сделали на нем несколько десятков сервисов и уже больше года активно эксплуатируем как раз в том самом продакшене, а так же рекомендуем его внутри, как основной, практически всем. За это время мы успели полюбить этот фреймворк, но при этом нашли его «зоны роста».

В своем докладе я постараюсь раскрыть три темы:

  1. сделаю краткий обзор на сам фреймворк
  2. поделюсь тем, чего ему не хватает для полноценной жизни в продакшене (с моей точки зрения)
  3. подсвечу довольно очевидные потенциальные проблемы.
Ну и, конечно же, займусь неймдроппингом: FastAPI!
Владислав Мухаматнуров, Тинькофф, Екатеринбург
Автоматизатор в команде питонистов
В докладе расскажу про личный опыт автоматизации тестирования в команде разработчиков-питонистов. На примере развития подходов к разработке и автоматизации тестирования внутри команды покажу эволюцию платформы голосового помощника «Олега». Этот проект из небольшого стартапа вырос до полноценного приложения для продуктов компании — чат-ботов и голосовых роботов.

Объясню, как благодаря нашему подходу к разработке объемных фичей появились полноценные приложения для тестирования: консольные и административные интерфейсы, окружения для локальной отладки, фреймворки по управлению и инструменты валидации системы. Всего того, что делает жизнь разработчика проще и технологичнее.

Для кого этот доклад:
Надеюсь, наш опыт станет вдохновляющим примером для разработчиков и их лидов, а уже потом — для QA в целом и автоматизаторов в частности.

Основные мысли доклада:
— Автоматизация тестирования — это часть этапа разработки, синергия творчества и контроля качества.
— Автоматизация на этапе разработки помогает снизить количество аксептансов и повысить качество ПО.
— Автоматизация на одном языке с разработкой позволяет перенимать лучшие практики и быстрее наращивать опыт отладки у разработчика, а также глубже разбираться в продукте автоматизатору.
— Даже с минимальными инструментами проверки программы в разы легче проверять ее функциональность и заниматься исследовательским тестированием.
— Каждый разработчик должен уметь тестировать свой код верхнеуровнево, а для этого нужны инструменты проверки.
— Тестируемые приложения — это круто.
— Геймификация разработки — это круто
Александр Морозов, Datafold, Москва
Семантический поиск по аналитическим данным с помощью Python и Neo4j
В докладе мы расскажем про графовые базы данных, для чего они нужны и когда стоит их использовать. Подробнее рассмотрим Neo4j и Grakn — в чем основные отличия, как обстоят дела с питонной экосистемой, почему в нашей компании Datafold для хранения метаданных мы остановились на Neo4j и на какие интересные особенности мы при этом натолкнулись.
Александр Шибаев, Тинькофф, Екатеринбург
Внедрение зависимостей, контейнеры и прочие проявления SOLID в питоне. Как жить на большом проекте.
Разные компоненты кода явно или неявно взаимодействуют между собой.

— Расскажу о проблемах неявных зависимостей на примере популярных библиотек питона — flask, django и других. Код с такими зависимостями сложно тестировать, конфигурировать, да и просто тяжело читать.

— Поделюсь способами решения этих проблем при помощи DI и покажу на примерах, в чем преимущество такого подхода. Расскажу про опыт нашей команды в написании такого кода. В примерах — FastAPI и Pydantic.

— Если следовать DI повсеместно, то со временем на большом проекте на конфигурирование самого приложения будет уходить много усилий. Поговорим, как мы решали эту проблему при помощи punq, как мы его модифицировали и какие дополнительные плюсы от этого получили.
Альбина Альмухаметова, Технократия, Казань
Оптимизация i-запросов в Django+Postgres или неточности документации
На рынке веб-разработки Django, пожалуй, один из самых популярных фреймворков. Но может ли оказаться так, что в документации такого «старичка» есть неточности?
В докладе расскажу о том, как оптимизация простого поискового запроса пошла не по плану.
Вспомним старые добрые индексы и разберёмся, какие нам действительно нужны, и как соединить их с нашим приложением.
В конце обсудим, что же нового случилось в 3 версии и как она упростила нам жизнь.
Владислав Лаухин, Райффайзен, Москва
Построение мониторинга python-приложений с использованием opentelemetry
Одно из главных требований к современным бэкенд-приложениям это observability. Для этого приложение должно генерировать большое количество разного рода информации — логи, метрики, трейсы.

Более того, эту информацию необходимо собирать и отправлять в специализированные инструменты для анализа и мониторинга. Все это требует какого-то невероятного количества разнородных инструментов, как с точки зрения инфраструктуры, так и с точки зрения кода. Такое количество инструментов больно поддерживать, а различия в их форматах и протоколах не дают простой возможности сменить один инструмент на другой.

В этом докладе мы поговорим о достаточно свежем проекте от CNCF под названием opentelemetry, который стандартизирует подход к observability и предоставляет единый фреймворк для отправки трейсов, метрик и логов.

Мы расскажем, в каких случаях его можно смело использовать на продакшене, в каких случаях вам для этого потребуется доля авантюризма, а чего сейчас нет, но припасено на будущее.
Мы обсудим как его применять его в python-проектах, что нужно для этого в инфраструктурном плане, и даже посмотрим живые примеры использования в нашем продакшене.
Данил Ахтаров, Тинькофф, Санкт-Петербург
Кеширование — делаем всё правильно
В докладе поделюсь опытом настройки политики кэширования данных в Python-приложениях.

Наверное, каждый, кто решал эту проблему, столкнулся с ней в неподходящий момент. Давайте сразу настроим «агрессивное» кэширование, а дальше будем оптимизировать инфраструктуру вокруг. А именно — решим вопросы:
— Какой backend использовать: redis, keydb? А, может, in memory?

— В каком формате хранить данные?

— Как мы можем это мониторить? Нам точно нужен кэш?

— Какой инструмент лучше всего подходит?

Артём Иннокентьев, Evrone, Якутск
Pattern matching: польза или хайп?
Осенью в Python завезут pattern matching. Так же как десять лет назад с аннотациями, разработчики языка пока не очень понимают для чего и как новая фича будет использоваться. И будет ли использоваться вообще.

Мы перерыли черновики, обсуждения, посмотрели на другие языки — и поделимся своими прогнозами. В докладе: лучшие применения для pattern matching, концепция «как рассказать кодом историю» и деревья. Много разных деревьев.
Анна Богданова, Ostrovok.ru, Москва
Rефакторинг: Regулярный и ASTообразный
Расскажу, как можно автоматизировать рефакторинг большой кодовой базы на примере перехода с синтаксиса одной библиотеки на синтаксис другой.

Покажу, как можно реализовать это двумя способами: с помощью регулярных выражений и с помощью абстрактных синтаксических деревьев.

Буду сравнивать оба подхода: что быстрее в реализации, что быстрее работает, какие нюансы стоит учитывать при выборе одного или второго подхода
Алексей Кузьмин, ДомКлик, Москва
Обработка ошибок в Python
В нашем IT-мире есть только один достоверный источник информации — исходный код. Документация может быть не актуальной, книжка может устареть, статья может осветить только один аспект. А исходный код — честен, доступен и открывает тайны всем, кто достаточно смел, чтобы заглянуть в него.

На мой взгляд нет ничего интереснее, чем поковыряться в нем и понять как работает та или иная технология, тот или иной инструмент на самом деле. Я приглашаю Вас в увлекательное приключение по обработке ошибок в Python cо стороны исходного кода — мы заглянем внутрь, увидим как работают основные механизмы обработки ошибок, рассмотрим частные виды исключений и их особенности и еще много чего интересного. Будет увлекательно, весело и даже по домашнему уютно! Приходите =)
Антон Палий, Тинькофф, Екатеринбург
Python и метрики. Мониторинг наше все
Пшшш, Хьюстон, у нас много данных. Пшшшш, нам нужно их отправить вам. Но данные постоянно меняются, вы сможете их обрабатывать в режиме реального времени?


У нас есть замечательные инструменты для технического и бизнесового мониторинга. Они позволяют нам придерживаться единого подхода при работе с постоянно меняющимися данными. Грех — эти инструменты не использовать и не рассказать о них.

В этом докладе я расскажу:
— как из python работать с метриками и как это делаем мы,
— какие они бывают, — как следить за технической и бизнесовой частью приложения,
— какие нестандартные части приложения можно мониторить благодаря инструменту Prometheus, чем это отличается от обычных логов и какие преимущества дает.

Вячеслав Буторов, Finvinci Volsor s.r.o., Прага (Чехия)
Как создать ваш собственный плагин для Sentry, при полном отсутствии документации

Мы много лет используем Sentry (28k звёзд, 3.2k форков на гитхабе) для мониторинга исключений на проектах, а так же мессенджер Telegram для общения. Когда я захотел получать уведомления об инцидентах из Sentry в Telegram, я не нашёл такой возможности, но что самое интересное — ни слова в официальной документации как добавить такой плагин.

Пройдя путь от негодования изучения устройства плагинов, поддерживаемых авторами Sentry и работы с ними в самом ядре Sentry, до создания своего плагина, используемого многими компаниями, я вижу, по поступающим вопросам, что интерес к теме не уменьшается со временем, а актуальной информации в сети всё так же нет.

Я вижу, что отдельные разработчики регулярно создают свои плагины для Sentry, но каждый из них вынужден проходить этот путь с нуля и самостоятельно, как это делал я.

Неплохо разобравшись в процессе с вопросом, я был бы рад поделиться знаниями с участниками PyCon.

Вместе со участниками мы пройдём по таким пунктам как:

  • общее устройство плагина для Sentry: от простого к более сложному
  • его место в общей архитектуре Sentry и как он запускается
  • проблема с использованием популярных плагинов в cloud версии Sentry
  • правильный способ установки плагинов в Sentry (грабли, по которым прошёл я, и провёл за собой N пользователей первых версий своего плагина)
  • добавление своих интерфейсов настроек в интерфейс Sentry
  • работа с сетью из вашего плагина: отправка запросов и получение их от внешних систем
  • работа с базой данных и миграциями
  • недокументированные, но вычленённые из исходников, best practice которые следует использовать при создании плагинов, чтобы не поотстреливать ноги себе и своему админу, который поддерживает Sentry
Максим Данилов, wPsoft, Landeck (Австрия)
Скрытая супер-сила Django Admin Panel в масштабируемом Backend приложении: долгий путь от отрицания к принятию
В своем докладе я расскажу о том, что на самом деле может django.contrib.admin, как и зачем преодолевать внутреннее сопротивление при работе с ним.

Django Admin Panel — сложный и мало документированный инструмент в Django Framework, который способен значительно повысить скорость разработки, если в нём по-настоящему разобраться.

— «A Не проще ли нам написать свой Backend?»
Я отвечу: «Нет, не проще!».
Семь лет инсайтов и открытий в моем докладе.
Сергей Матвиенко, Олег Ивашов, Assaia, Санкт-Петербург
Шина сообщений NSQ в Python — что это, зачем и как
Часто при выборе шины сообщений для Python проекта выбор сводится к Kafka или RabbitMQ. Однако, есть ещё одна менее известная в Python-сообществе альтернатива — NSQ.

Сергей расскажет как прийти к выбору NSQ для вашего проекта, про положительные и отрицательные стороны использования NSQ в продакшене.

Олег покажет библиотеку ansq, приемы её удобного использования и расскажет про подводные камни, с которыми пришлось столкнуться.

Доклад основан на опыте использования NSQ в большом реальном продукте на протяжении последних 1.5 лет.
Александр Шибаев, Тинькофф, Екатеринбург
Внедрение зависимостей, контейнеры и прочие проявления SOLID в питоне. Как жить на большом проекте
Код не существует без зависимостей. Разные его компоненты явно или неявно взаимодействуют между собой. У неявных зависимостей есть ряд проблем, о которых я расскажу на примере популярных библиотек питона. (flask, django, …)
Такой код сложно тестировать, конфигурировать, да и просто тяжелее читать.

Расскажу о способах решения этих проблем при помощи DI и покажу на примерах,
в чём преимущество такого подхода в большинстве случаев. Расскажу про опыт нашей команды в написании такого кода.

В примерах будут фигурировать FastAPI и Pydantic. Если следовать DI повсеместно, то на большом проекте со временем на конфигурирование самого приложения начнет
тратиться куча усилий. Поговорим, как мы решали эту проблему при помощи punq,
как нам пришлось его модифицировать, и какие дополнительные плюшки мы от этого получили.
Андрей Ермилов, Максим Белоусов, Avito.tech + Rambler, Москва
Практические советы по использованию опциональной статической типизации
На тему использования опциональной статический типизации в Python написано много статей.

В докладе мы не будем повторять прописные истины, а попробуем ответить на вопрос для чего нужно ее использовать, на примерах разберем, как это можно делать и покажем преимущества, которая она дает.

Также мы коснемся сложностей, которые возникают при использовании типизации и продемонстрируем способы их решения.
ML & Data Science
Антон Киселев
Provectus, Казань
Best Practices for Kubeflow Pipelines
Тезисы
Андрей Алексеев
Тинькофф, Москва
ETNA Time Series Library: удобное прогнозирование временных рядов
Тезисы
Иван Санин
Авито, Новосибирск
Разгоняем ML в проде
Тезисы
Богдан Володарский
Provectus, Казань
Data/ML QA on Python
Тезисы
Ярослав Игошев
Intel, Москва
Distributed Data Processing and XGBoost Training and Prediction
Тезисы
Тимур Кадыров, Артём Королёв
Сбер (Лаборатория нейронаук и поведения человека), Москва
Катим хоббийный проект в прод на AWS
Тезисы
Тимур Кадыров, Артем Королев, Сбер (Лаборатория нейронаук и поведения человека)
Катим хоббийный проект в прод на AWS
Артем и Тимур расскажут, как важно посещать пайконы, ведь посещение мероприятия вдохновило парней на целый хоббийный проект. Получив фотки с прошлого пайкона, ребята сразу задумались, как не отсматривая весь архив, найти фотки только с собой. Дальше осталось реализовать эту идею на питоне.

Расскажем:
 — блокнотик в Jupyter, а не сервис, и куда с ним пойти дальше
 — выбор облака
 — виртуалки для слабаков и тех, у кого есть деньги
 — зачем писать фронт, если можно прототипировать в телеграме
 — костыли и грабли, на которые стоит наступить, когда ты ds и никогда не катил в прод на облаке
 — а какая у нас в итоге архитектура?
 — модель не влезает в serverless функцию или борьба не на жизнь, а на смерть
 — готовый проект и мечты о том, как его сделать еще лучше
Иван Санин, Авито, Новосибирск
Разгоняем ML в проде
В нашей команде более 30 однотипных ml микросервисов, и их число постоянно растет. Перед бэкенд инженерами стоят задачи обеспечения максимального rps, оптимизации использования железа и централизованного распространения лучших практик и фич между сервисами.

В результате решения этих задач появился фреймворк «Акведук», позволяющий описать пайплайн обработки данных, концентрируясь на его логическом устройстве, а не технических деталях.

C технической точки зрения Акведук представляет собой легковесную python библиотеку, активно использующую возможности пакетов `multiprocessing` и `asyncio`.

В своем докладе я подробно расскажу, как мы пришли к идее и усовершенствовали наш фреймворк, сравню с другими известными решениями и дам практические рекомендации по использованию Акведука.
Андрей Алексеев, Тинькофф, Москва
ETNA Time Series Library: удобное прогнозирование временных рядов
Временные ряды — это любые данные, у которых есть временная метка. Некоторые ряды нужно прогнозировать — например, сколько глазированных сырков купят на этой неделе, сколько посетителей будет в магазине, сколько наличных останется в банкомате. Для их прогноза нужны разные модели и признаки, но подход к исследованию проблемы будет одинаковый.
Сначала мы пробовали решать каждую отдельную задачу усилиями разных ML-специалистов: это было долго, каждый пилил свой собственный «велосипед», не было обмена опытом и не спасало от ошибок. Поэтому мы решили сделать ML-эксперименты с временными рядами простыми и быстрыми — и придумали библиотеку ETNA.

Главные ценности ETNA:

— Гибкость

— Простота

— Расширяемость

Расскажем:

— Что такое временной ряд

— Как его прогнозировать

— О болях, которые хотим решить

— Как придумали библиотеку и внедрили библиотеку

— Как добавляли и выпиливали фичи и рефакторы

— Что библиотека представляет из себя сейчас

— Что мы узнали пока ее делали
Антон Киселев, Provectus, Казань
Best Practices for Kubeflow Pipelines
В своем докладе я расскажу про Kubeflow — MLOps-инструмент для Kubernetes, с упором на Kubeflow Pipelines. Обсудим процесс разработки пайплайнов и компонент, использование библиотеки готовых компонент, а также лучшие практики для эффективного использования ресурсов Kubernetes для обучения моделей. Разберем кейс по обучению модели классификации картинок.
Богдан Володарский, Provectus, Казань
Data/ML QA on Python
Сегмент данных взрослеет и за этим следует потребность в их валидации.
Расскажу как построить процесс тестирования на данных на проекте на основе фреймворка great expecations. Как интегрироваться в дата пайплайн в AWS. Расскажу, как мы решили проблему репортинга и дашбординга + как на результатах Data QA устроить ML QA
Ярослав Игошев, Intel, Москва
Distributed Data Processing and XGBoost Training and Prediction
Расскажу о том, как можно ускорить пайплайн, который включает в себя обработку данных, обучение XGBoost модели и предсказание, даваемой этой моделью, за счет распределения вычислений на множество процессов.

При этом вам не придется изучать новые библиотеки и их API. Фокус будет сосредоточен вокруг небольшого ряда библиотек хорошо известных людям, которые знакомы с Data Science и Machine Learning.
В частности, речь пойдет о таких библиотеках как pandas, Modin и XGBoost.
Покажу, как Modin позволяет ускорить pandas запросы, всего лишь, изменив одну строку кода вашего сценария, а также расскажу о его распределенной реализации обучения и прогнозирования XGBoost модели.
Мастер-классы
Илья Иваников
Тинькофф, Москва
Flask-Admin, SQLAlchemy и FastAPI. Или как приготовить простой и удобный инструмент для работы с любыми унифицированными документами
Тезисы
Александр Демидовский, Ярослав Таркан
Intel, Нижний Новгород
OpenVINO DL Workbench: Знакомимся с Deep Learning и пишем своё первое AI приложение
Тезисы
Александр Абрамов
SberDevices, Москва
Тюнинг языковой модели SBERT для ваших проектов на примере задач классификации
Тезисы
Ярослав Таркан, Алексaндр Демидовский, Intel, Нижний Новгород
OpenVINO DL Workbench: Знакомимся с Deep Learning и пишем своё первое AI приложение
Рассмотрим популярный фреймворк для инференса нейронных сетей OpenVINO и его графическую оболочку OpenVINO Deep Learning Workbench.

Разберемся, как начать работать с предварительно обученными нейронными сетями, чтобы написать своё первое приложение с элементами AI.

Узнаем, что такое инференс, оптимизация, модель, датасет, акселератор.

Применим полученные знания на практике и напишем приложение, которое с помощью оптимизированной нейронной сети быстро справляется с поставленными задачами.
Александр Абрамов, SberDevices, Москва
Тюнинг языковой модели SBERT для ваших проектов на примере задач классификации

В рамках мастер-класса вы узнаете о современных языковых моделях — трансформерах.
Познакомитесь с моделью русского языка от SberDevices — SBERT.

Также мы рассмотрим классические кейсы NLP (Natural Language Proccesing) по решению таких задач классификации как:

  • сентимент-анализ и поиск именованных сущностей;
  • семантический поиск на основе работы с языковой моделью SBERT.
Приглашаю вас попробовать свои силы в решении этих задач с помощью инструментов глубокого обучения Tensorflow и PyTorch.
Илья Иванников, Тинькофф, Москва
Flask-Admin, SQLAlchemy и FastAPI или как приготовить простой и удобный интрумент для работы с любыми унифицированными документами.
Многим компаниям нужно хранить документы или данные — и при этом доставать или редактировать их без риска поломать базу данных.
В своем мастер-классе я покажу, как с помощью Flask-Admin, SQLAlchemy и FastApi собрать инструмент, который позволит на лету создавать и менять документы.

Для участия в мастер-классе надо иметь python 3.7 и желательно делать все на linix/macos. (На винде тоже можно, но Илья, если будут проблемы, помочь не сможет).
Также скачайте заранее этот репозиторий на гитхабе, чтобы не тратить время на мастер-классе.

Хочу следить за новостями PyCon Russia

Нажимая кнопку отправить, вы соглашаетесь с Политикой конфиденциальности