mlops engineer
генерация резюме под вакансию
сопроводительное письмо
описание
Описания нет
задачи
- Проектировать и развивать AI Gateway для управления доступом к LLM, маршрутизацией запросов, лимитами и ролевой моделью доступа;
- Развивать платформу LLM-инференса, включая развертывание open-source моделей, управление версиями и мониторинг производительности;
- Развивать RAG-платформу, включая работу с векторными индексами, гибридным поиском и сервисом эмбеддингов;
- Развивать Agent Runtime для сопровождения агентных графов и управления состоянием;
- Развивать MCP Gateway/Registry для стандартизации интеграций и мониторинга вызовов инструментов;
- Автоматизировать жизненный цикл GenAI-артефактов, включая CI/CD-пайплайны и интеграционные тесты;
- Развивать платформу оценивания качества GenAI-решений с использованием автоматических проверок и метрик;
- Развивать наблюдаемость GenAI-систем, включая трассировку запросов и мониторинг метрик качества и стоимости;
- Внедрять защитные механизмы для GenAI-сервисов, включая защиту от prompt injection и контроль чувствительных данных;
- Оптимизировать использование вычислительных ресурсов для LLM и агентных сценариев;
- Исследовать новые инструменты и подходы в GenAIOps для повышения надежности и эффективности платформы.
требования
- Опыт промышленной разработки, внедрения или эксплуатации GenAI-, ML- или Data-платформ;
- Практический опыт работы с LLM-инференсом (vLLM, Text Generation Inference, Triton Inference Server, llama.cpp);
- Понимание особенностей эксплуатации LLM (задержки, throughput, batch-запросы, контекстное окно, GPU-ресурсы);
- Опыт проектирования или эксплуатации API для доступа к моделям;
- Понимание принципов RAG (эмбеддинги, векторный и гибридный поиск, reranking, версионирование индексов);
- Практический опыт работы с векторными хранилищами и поисковыми движками (FAISS, Qdrant, Milvus, OpenSearch, Elasticsearch);
- Понимание архитектуры AI-агентов (инструменты, память, графы выполнения, асинхронная обработка);
- Опыт запуска и сопровождения сервисов в Kubernetes;
- Опыт настройки CI/CD для сервисов или ML-артефактов;
- Уверенное владение Python для разработки платформенных сервисов и автоматизации;
- Опыт работы с Docker и OCI-образами;
- Понимание принципов мониторинга и алертинга для GenAI-систем;
- Понимание подходов к оцениванию GenAI-решений (golden datasets, regression tests, LLM-as-judge);
- Опыт безопасной работы с секретами, токенами и сервисными учетными записями;
- Понимание основных рисков генеративного ИИ (галлюцинации, prompt injection, утечки данных);
- Уверенное владение Linux;
- Будет плюсом опыт работы с GitLab.
условия
- ДМС со стоматологией, телемедициной и программой поддержки ментального здоровья;
- Страхование жизни;
- Ежемесячные промокоды на Lamoda и программа привилегий BestBenefits;
- Оплата до 15 дней больничного в год в размере 100% от оклада;
- Бесплатные юридические консультации;
- Дополнительные выходные в случае важных событий;
- Обучение, участие в конференциях и помощь в развитии личного бренда;
- Регулярные Performance Review, митапы и demo-дни.
навыки
Если просят войти через iCloud, отправить коды из SMS, запустить код, что-то установить, перевести деньги или сделать что угодно, связанное с деньгами, не соглашайтесь: это признаки мошенничества.