Если вас просят войти через iCloud/Google, отправить коды из SMS или Telegram, запустить код или что-то установить, не соглашайтесь: это признаки мошенничества.
mlops engineer
сопроводительное письмо
описание
Т1 сопровождает и развивает инфраструктуру в закрытых контурах, участвует в проектировании и обновлении систем, обеспечивает надежную работу сервисов на всех этапах их жизненного цикла.
задачи
- Поддерживать ML-сервисы на уровне 3-й линии (инциденты, изменения, оптимизация).
- Сопровождать инфраструктуру по проектам со стороны заказчика/потребителя ресурсов.
- Участвовать в релизных процессах, процессах разработки, тестирования и сопровождения.
- Проектировать и обновлять системы с учетом требований надежности и масштабируемости.
- Проводить инфраструктурные ревью, оптимизации и экспертизы.
- Взаимодействовать с командами разработчиков, аналитиков, DevOps и информационной безопасности.
- Описывать и документировать процессы интеграции и взаимодействия со смежными системами.
- Сопровождать ML-решения на протяжении всего жизненного цикла.
- Прикладно сопровождать ML-сервисы и инфраструктуру в рамках 3ЛС.
требования
- Знание архитектурных паттернов (монолит, SOA, микросервисы, event-driven и др.).
- Опыт сопровождения высоконагруженных систем.
- Опыт работы с контейнеризацией (Docker, Kubernetes).
- Глубокое понимание сетевых протоколов, баз данных и принципов безопасности.
- Умение составлять техническую документацию.
- Опыт работы с баг-трекерами (Jira, Redmine, Mantis).
- Понимание принципов CI/CD.
- Опыт работы с системой контроля версий Git.
- Будет плюсом опыт проектирования и сопровождения инфраструктуры в средах с повышенными требованиями к безопасности (закрытые контуры, финансовая сфера), знание принципов построения отказоустойчивых и масштабируемых систем (High Availability / Fault Tolerance, кластеризация, балансировка, резервирование), опыт работы с системами мониторинга и логирования (Prometheus, Grafana, ELK/EFK, Zabbix), навыки работы с инструментами управления конфигурациями и IaC (Terraform, Ansible, Helm, Kustomize), опыт взаимодействия с системами очередей и стриминговой обработки (Kafka, RabbitMQ), понимание принципов Observability (метрики, логи, трейсы), навыки оптимизации производительности приложений и инфраструктуры (в том числе GPU/CPU/RAM ресурсы в Kubernetes), умение формализовать и документировать технические решения, готовить архитектурные схемы и спецификации, опыт работы с BigData-технологиями, опыт работы с корпоративными хранилищами данных и понимание принципов их построения.
условия
- Удаленная работа.
- Гибридный формат работы.
навыки