Если просят войти через iCloud, отправить коды из SMS, запустить код, что-то установить, перевести деньги или сделать что угодно, связанное с деньгами, не соглашайтесь: это признаки мошенничества.
support engineer
генерация резюме
сопроводительное письмо
описание
Команда разрабатывает единую технологическую платформу для создания, развертывания и эксплуатации решений на основе больших языковых моделей с использованием инфраструктуры АС «Суперкомпьютер». Проект направлен на промышленное внедрение ИИ с централизацией управления безопасностью, качеством и стоимостью, а также настройкой приоритизации клиентских запросов.
задачи
- Мониторить состояние сервисов инференса в Kubernetes;
- Диагностировать проблемы с запуском контейнеров моделей;
- Настраивать дашборды для отслеживания метрик качества сервисов;
- Реагировать на инциденты, собирать логи и анализировать трассировки;
- Эскалировать задачи разработчикам при невозможности устранения проблемы;
- Анализировать причины деградации производительности моделей;
- Консультировать пользователей по использованию API платформы;
- Обучать пользователей работе с инструментами платформы;
- Создавать инструкции и FAQ по типовым задачам развертывания;
- Управлять доступом к функциям платформы согласно политикам безопасности;
- Контролировать соблюдение регламентов при работе с данными;
- Создавать базы данных и роли в Milvus, назначать права доступа;
- Поддерживать дашборды Grafana для векторной базы данных;
- Реагировать на алерты по состоянию векторной базы данных.
требования
- Опыт использования Kubernetes, включая диагностику подов, работу с kubectl, понимание сетевых технологий и хранилищ;
- Понимание принципов работы моделей машинного обучения, включая инференс, API моделей и форматы данных;
- Опыт настройки мониторинга и алертинга с использованием Prometheus, Grafana, ELK;
- Навыки написания скриптов на Python или Bash для автоматизации задач;
- Умение работать с пользователями и составлять техническую документацию;
- Свободное владение русским языком;
- Будет плюсом опыт поддержки MLOps-платформ (MLflow, Kubeflow), знание практик информационной безопасности для систем машинного обучения, опыт работы с векторными базами данных (Milvus, Qdrant, Weaviate), понимание архитектуры Milvus и знание специфических метрик и процедур поддержки Milvus.
условия
- ДМС и страхование жизни;
- Корпоративные мероприятия;
- Культура обратной связи;
- Внутренняя ротация и ежегодная оценка;
- Наставничество и менторство;
- Обучение и повышение квалификации;
- Индивидуальный план развития;
- Реферальная программа;
- Внутренние IT-сообщества.
навыки