Если вас просят войти через iCloud/Google, отправить коды из SMS или Telegram, запустить код или что-то установить, не соглашайтесь: это признаки мошенничества.
product manager (tech)
сопроводительное письмо
описание
Nebius AI — это облачная платформа для искусственного интеллекта, предлагающая одну из крупнейших в Европе мощностей GPU. Платформа Nebius AI предоставляет высокопроизводительную инфраструктуру, оптимизированную для обучения, и различные GPU NVIDIA для обучения и инференса, а также набор инструментов для эффективного многоузлового обучения. Компания владеет дата-центром в Финляндии, построенным собственными силами, который является одним из самых мощных коммерчески доступных суперкомпьютеров в Европе. Штаб-квартира Nebius находится в Амстердаме, Нидерланды, с R&D хабами по всей Европе и Ближнему Востоку.
задачи
- Владеть возможностями обеспечения надёжности и производительности на всём стеке Nebius: от bare metal до приложений.
- Определять направление развития продукта от начала до конца: исследование проблем → проектирование → поставка → внедрение.
- Управлять кросс-функциональным исполнением в командах, отвечающих за вычисления, сети, хранение данных, наблюдаемость, платформу и оборудование.
- Вести глубокие исследования проблем с помощью интервью с клиентами, аналитики, изучения рабочих нагрузок и анализа логов.
- Выявлять и приоритизировать узкие места, влияющие на производительность и стабильность крупномасштабного обучения/инференса.
- Транслировать передовые исследования в области ML/инфраструктуры в практические, масштабируемые возможности продукта.
- Определять и операционализировать метрики продукта для пользовательского опыта кластера (например, надёжность, эффективность, задержка запуска, утилизация, пропускная способность).
требования
- 3–5+ лет опыта в одной или нескольких областях: управление продуктом, HPC, ML-инфраструктура/MLOps, распределённые системы, SRE, облачная архитектура или GPU-платформы.
- Сильная техническая база в распределённых системах, облачной инфраструктуре или ML-платформах.
- Практический опыт работы с средами оркестрации ML (например, Slurm, Kubernetes, Ray или аналогичными).
- Опыт реализации технически сложных инициатив с участием нескольких инженерных команд.
- Сильные коммуникативные навыки и способность влиять на инженеров, исследователей и клиентов.
- Опыт использования аналитики и данных для принятия решений по дорожной карте.
- Высокий уровень ответственности, скорость обучения и комфорт в быстро развивающихся средах AI-инфраструктуры.
- Будет плюсом опыт работы с GPU-платформами и HPC-технологиями (InfiniBand/RDMA, системы с учётом топологии), знакомство с современными ML-стеками для обучения (PyTorch, DeepSpeed, FSDP/ZeRO, NCCL), понимание метрик эффективности обучения и сигналов эксплуатации (Goodput, MFU, качество планирования, проверки работоспособности), опыт работы с крупномасштабными системами обучения или инференса LLM, опыт в области наблюдаемости, настройки производительности или инженерии надёжности, клиентский технический опыт поддержки ML или инфраструктурных рабочих нагрузок.
условия
- Конкурентная заработная плата и комплексный пакет льгот.
- Возможности для профессионального роста в Nebius.
- Гибкие условия работы.
- Динамичная и совместная рабочая среда, которая ценит инициативу и инновации.
навыки