Сбер
сегодня

infrastructure engineer

в пределах рынка
вакансия ~ 467 700 ₽
в среднем 454 832 ₽
мэтч
Добавь резюме в профиле, чтобы видеть % мэтча с вакансией

сопроводительное письмо

Добавь резюме в профиле, а нейросеть определит твою категорию. Затем ты сможешь генерировать сопроводительные письма для вакансий этой категории

описание

Команда строит высокопроизводительную инфраструктуру для искусственного интеллекта, которая позволяет Data Scientist'ам и ML Engineer'ам экспериментировать, обучать сложные модели и выводить их в продакшен.

Вам нужно будет формировать и реализовывать технологическую стратегию развития AI/ML-инфраструктуры, проектировать и внедрять масштабируемую и отказоустойчивую инфраструктуру для обучения и инференса моделей, обеспечивать эксплуатацию инфраструктуры полного цикла — планирование, развертывание, мониторинг, оптимизация затрат, руководить командой инженеров (MLOps/ML Platform, DevOps, SRE) и обеспечивать выполнение задач в срок, управлять AI/HPC-кластерами, GPU-узлами и обеспечивать эффективную утилизацию ресурсов, внедрять новые технологии и инструменты в области высокопроизводительных вычислений, сетей и систем хранения, взаимодействовать с командами Data Science, Machine Learning и бизнес-подразделениями для согласования требований, формировать и поддерживать стандарты надежности, безопасности и эффективности инфраструктуры, поддерживать актуальную техническую документацию.

требования

  • Опыт руководства или тимлид-роли в построении и эксплуатации ML/AI-инфраструктуры (от 2 лет)
  • Практический опыт работы с AI/HPC-кластерами и GPU-инфраструктурой (NVIDIA)
  • Опыт построения и дизайна AI-инфраструктуры в ЦОД (проектирование кластеров)
  • Опыт работы и понимание Kubernetes и SLURM с их экосистемой (Helm, Operators)
  • Опыт использования MLOps-фреймворков (Kubeflow, MLflow, Airflow/Flyte, Vertex AI, Sagemaker и др.)
  • Знание систем хранения и работы с большими данными (S3, GCS, NFS, Lustre)
  • Опыт построения инфраструктуры для LLM и распределённого обучения моделей
  • Понимание жизненного цикла ML-моделей и задач эксплуатации на всех этапах
  • Навыки управления командой, планирования ресурсов и контроля бюджета
  • Опыт работы с on-premise инфраструктурой и понимание принципов масштабирования
  • Будет плюсом новые технологии в области высокопроизводительных вычислений, сетей и систем хранения

условия

  • Офис рядом с м. Кутузовская
  • Офисный формат работы, после испытательного срока гибридный формат (3 дня офис + 2 дня удалённо)
  • Ежегодный пересмотр зарплаты и годовая премия
  • Уникальная система обучения Сбера для профессионального и карьерного развития
  • Расширенный ДМС и льготное страхование для семьи
  • Гибкий дисконт по ипотечному кредиту, равный 1/3 ключевой ставки ЦБ
  • Бесплатная подписка СберПрайм+, скидки на продукты компаний-партнёров
  • Вознаграждение за рекомендацию друзей в команду Сбера
  • Корпоративная пенсионная программа
Откликнуться Добавить в отклики