Tabby
31 янв

mlops engineer

выше рынка на 44,8%
вакансия 514 500 ₽
в среднем 355 198 ₽
мэтч
Добавь резюме в профиле, чтобы видеть % мэтча с вакансией

сопроводительное письмо

Добавь резюме в профиле, а нейросеть определит твою категорию. Затем ты сможешь генерировать сопроводительные письма для вакансий этой категории

описание

Нужен английский B2 или выше. Есть релокация в Армению, Грузию, Сербию и Испанию

Команда занимается разработкой инфраструктуры для высокопроизводительного обслуживания LLM, реального времени обработки данных и управления моделями в финтех-единороге. Вам нужно будет настраивать высокопроизводительное обслуживание моделей с vLLM, NVIDIA TensorRT-LLM и sglang, оптимизировать крупные открытые модели типа DeepSeek и Qwen, управлять весами моделей в Kubernetes на GKE, проектировать CDC-пайплайны с Debezium и Kafka для синхронизации данных из Cloud PostgreSQL, настраивать ClickHouse для аналитики и хранения фич, оркестрировать ML-воркфлоу в Airflow, настраивать Linux-системы и сеть с Istio, управлять GPU-узлами A100/H100 с Ansible, внедрять CI/CD в GitLab CI, использовать IaC с Terraform и Terragrunt, писать автоматизацию на Python и Bash, проводить нагрузочное тестирование GenAI-приложений и настраивать мониторинг в Datadog с LiteLLM Gateway.

требования

  • Глубокий опыт высокопроизводительного обслуживания с vLLM, NVIDIA TensorRT-LLM и sglang
  • Опыт деплоя и оптимизации крупных открытых моделей DeepSeek 3.1/3.2, Qwen и GPT-OSS
  • Продвинутые навыки оптимизации и защиты Docker для GPU
  • Управление моделями и оркестрация в Kubernetes (GKE)
  • Проектирование CDC-пайплайнов с Apache (Debezium, Kafka) для Cloud PostgreSQL
  • Настройка ClickHouse для реального времени аналитики, ML-фич и логирования
  • Оркестрация ML-воркфлоу в Airflow (Google Cloud Composer)
  • Сильные знания Linux, сети и тюнинга для распределённых систем
  • Опыт Istio для микросервисов
  • Управление GPU-узлами (A100/H100/H200) с Ansible
  • Знания Kubernetes: контроллеры, CRD, CNI, Ingress
  • CI/CD в GitLab CI с runners, кэшированием и сканнингом
  • IaC с Terraform и Terragrunt
  • Python и Bash для автоматизации
  • Нагрузочное тестирование GenAI с метриками TTFT, TPS, RPS
  • LiteLLM Gateway для API, балансировки и трекинга затрат
  • Datadog для мониторинга GPU, инференса и логов
  • Будет плюсом опыт с PCI-DSS, SOC2 или комплаенс-регуляциями

условия

  • Полная занятость по B2B-контракту
  • До 20% налоговых льгот
  • 22 дня оплачиваемого отпуска в год
  • Опционы на акции (ESOP) в растущей pre-IPO компании
  • Гибкие бонусы на здоровье, путешествия или обучение
  • Поддержка релокации в Армению, Грузию, Сербию и Испанию с перелётами, временным жильём и легализацией
Откликнуться Добавить в отклики