mlops engineer
сопроводительное письмо
описание
Команда занимается разработкой инфраструктуры для высокопроизводительного обслуживания LLM, реального времени обработки данных и управления моделями в финтех-единороге. Вам нужно будет настраивать высокопроизводительное обслуживание моделей с vLLM, NVIDIA TensorRT-LLM и sglang, оптимизировать крупные открытые модели типа DeepSeek и Qwen, управлять весами моделей в Kubernetes на GKE, проектировать CDC-пайплайны с Debezium и Kafka для синхронизации данных из Cloud PostgreSQL, настраивать ClickHouse для аналитики и хранения фич, оркестрировать ML-воркфлоу в Airflow, настраивать Linux-системы и сеть с Istio, управлять GPU-узлами A100/H100 с Ansible, внедрять CI/CD в GitLab CI, использовать IaC с Terraform и Terragrunt, писать автоматизацию на Python и Bash, проводить нагрузочное тестирование GenAI-приложений и настраивать мониторинг в Datadog с LiteLLM Gateway.
требования
- Глубокий опыт высокопроизводительного обслуживания с vLLM, NVIDIA TensorRT-LLM и sglang
- Опыт деплоя и оптимизации крупных открытых моделей DeepSeek 3.1/3.2, Qwen и GPT-OSS
- Продвинутые навыки оптимизации и защиты Docker для GPU
- Управление моделями и оркестрация в Kubernetes (GKE)
- Проектирование CDC-пайплайнов с Apache (Debezium, Kafka) для Cloud PostgreSQL
- Настройка ClickHouse для реального времени аналитики, ML-фич и логирования
- Оркестрация ML-воркфлоу в Airflow (Google Cloud Composer)
- Сильные знания Linux, сети и тюнинга для распределённых систем
- Опыт Istio для микросервисов
- Управление GPU-узлами (A100/H100/H200) с Ansible
- Знания Kubernetes: контроллеры, CRD, CNI, Ingress
- CI/CD в GitLab CI с runners, кэшированием и сканнингом
- IaC с Terraform и Terragrunt
- Python и Bash для автоматизации
- Нагрузочное тестирование GenAI с метриками TTFT, TPS, RPS
- LiteLLM Gateway для API, балансировки и трекинга затрат
- Datadog для мониторинга GPU, инференса и логов
- Будет плюсом опыт с PCI-DSS, SOC2 или комплаенс-регуляциями
условия
- Полная занятость по B2B-контракту
- До 20% налоговых льгот
- 22 дня оплачиваемого отпуска в год
- Опционы на акции (ESOP) в растущей pre-IPO компании
- Гибкие бонусы на здоровье, путешествия или обучение
- Поддержка релокации в Армению, Грузию, Сербию и Испанию с перелётами, временным жильём и легализацией
навыки