mlops engineer

в пределах рынка

вакансия 240 791 ₽

в среднем 236 992 ₽

мэтч

Загрузи резюме, чтобы видеть мэтчи с вакансией

генерация резюме под вакансию

Загрузи резюме в профиль, чтобы сгенерировать временное CV под эту вакансию

сопроводительное письмо

Загрузи резюме в профиль, а нейросеть определит твою категорию. Затем ты сможешь генерировать сопроводительные письма для вакансий этой категории

описание

Описания нет

задачи

Проектировать и развивать AI Gateway для управления доступом к LLM, маршрутизацией запросов, лимитами и ролевой моделью доступа;
Развивать платформу LLM-инференса, включая развертывание open-source моделей, управление версиями и мониторинг производительности;
Развивать RAG-платформу, включая работу с векторными индексами, гибридным поиском и сервисом эмбеддингов;
Развивать Agent Runtime для сопровождения агентных графов и управления состоянием;
Развивать MCP Gateway/Registry для стандартизации интеграций и мониторинга вызовов инструментов;
Автоматизировать жизненный цикл GenAI-артефактов, включая CI/CD-пайплайны и интеграционные тесты;
Развивать платформу оценивания качества GenAI-решений с использованием автоматических проверок и метрик;
Развивать наблюдаемость GenAI-систем, включая трассировку запросов и мониторинг метрик качества и стоимости;
Внедрять защитные механизмы для GenAI-сервисов, включая защиту от prompt injection и контроль чувствительных данных;
Оптимизировать использование вычислительных ресурсов для LLM и агентных сценариев;
Исследовать новые инструменты и подходы в GenAIOps для повышения надежности и эффективности платформы.

требования

Опыт промышленной разработки, внедрения или эксплуатации GenAI-, ML- или Data-платформ;
Практический опыт работы с LLM-инференсом (vLLM, Text Generation Inference, Triton Inference Server, llama.cpp);
Понимание особенностей эксплуатации LLM (задержки, throughput, batch-запросы, контекстное окно, GPU-ресурсы);
Опыт проектирования или эксплуатации API для доступа к моделям;
Понимание принципов RAG (эмбеддинги, векторный и гибридный поиск, reranking, версионирование индексов);
Практический опыт работы с векторными хранилищами и поисковыми движками (FAISS, Qdrant, Milvus, OpenSearch, Elasticsearch);
Понимание архитектуры AI-агентов (инструменты, память, графы выполнения, асинхронная обработка);
Опыт запуска и сопровождения сервисов в Kubernetes;
Опыт настройки CI/CD для сервисов или ML-артефактов;
Уверенное владение Python для разработки платформенных сервисов и автоматизации;
Опыт работы с Docker и OCI-образами;
Понимание принципов мониторинга и алертинга для GenAI-систем;
Понимание подходов к оцениванию GenAI-решений (golden datasets, regression tests, LLM-as-judge);
Опыт безопасной работы с секретами, токенами и сервисными учетными записями;
Понимание основных рисков генеративного ИИ (галлюцинации, prompt injection, утечки данных);
Уверенное владение Linux;
Будет плюсом опыт работы с GitLab.

условия

ДМС со стоматологией, телемедициной и программой поддержки ментального здоровья;
Страхование жизни;
Ежемесячные промокоды на Lamoda и программа привилегий BestBenefits;
Оплата до 15 дней больничного в год в размере 100% от оклада;
Бесплатные юридические консультации;
Дополнительные выходные в случае важных событий;
Обучение, участие в конференциях и помощь в развитии личного бренда;
Регулярные Performance Review, митапы и demo-дни.

навыки

python kubernetes docker llm rag ci/cd linux genai ml vllm faiss qdrant elasticsearch gitlab api

Если просят войти через iCloud, отправить коды из SMS, запустить код, что-то установить, перевести деньги или сделать что угодно, связанное с деньгами, не соглашайтесь: это признаки мошенничества.

зарплата по оценке AI

Добавить в трекер

Откликнуться В трекер