site reliability engineer
сопроводительное письмо
описание
PandaDoc предоставляет платформу для автоматизации документооборота, которая помогает быстро растущим командам создавать, управлять и подписывать цифровые документы вроде предложений, котировок и контрактов. Вам нужно будет владеть процессом управления инцидентами от начала до конца, поддерживать и развивать стек наблюдаемости на собственных серверах, следить за бесперебойной работой продакшена через дежурства в ротации, разрабатывать автоматизации и инструменты для надёжности платформы, вносить вклад в продакшен-сервисы с фокусом на производительность и устойчивость, сотрудничать с продуктовыми инженерами для внедрения принципов SRE в R&D, менторствовать команду SRE или продуктовых инженеров.
требования
- Хороший опыт программирования, особенно Python (Django и AsyncIO) и/или Java (Spring Boot)
- Опыт поддержки стека наблюдаемости (конкретно LGTM - Loki, Grafana, Tempo, Mimir)
- Опыт разработки и поддержки Python-сервисов в продакшене
- Сильный опыт с AWS и Kubernetes
- Уверенная работа с реляционными базами (PostgreSQL) и системами сообщений (RabbitMQ, NATS, Kafka)
- Опыт SRE-инженера с дежурствами
- Умеете разбираться в распределённых системах в продакшене
- Владеете английским письменно и устно
- Будет плюсом любовь к ручному дебагу, ownership, коммуникации и обмену знаниями по надёжности
условия
- Удалёнка с опцией гибрида в офисах Киева, Варшавы и Лиссабона
- Долгосрочное сотрудничество через трудовой договор, EOR или B2B (уточняйте у рекрутеров)
- График по европейским часовым поясам
- Открытая культура с обратной связью
- Развитие в поддерживающей команде
- Стабильный растущий SaaS-продукт с agile, ownership и техвызовами
навыки