Команда ML-Инфраструктуры Ozon Tech создаёт платформенные сервисы для упрощения разработки и эксплуатации ML-решений. Их цель — предоставить учёным и аналитикам мощные инструменты для запуска экспериментов, развёртывания моделей и управления ресурсами, объединяя команды в единую ML-экосистему.
Разработчик будет развивать ML Job Scheduler (управление задачами и ресурсами в Kubernetes), создавать Model as a Service (инференс с оптимизацией CPU/GPU), работать над DataFlow (доставка данных для обучения) и проектировать новые компоненты ML-платформы. В задачи входит оптимизация распределения GPU, снижение задержек инференса, обеспечение стабильной доставки данных и редизайн архитектуры сервисов.