Если просят войти через iCloud, отправить коды из SMS, запустить код, что-то установить, перевести деньги или сделать что угодно, связанное с деньгами, не соглашайтесь: это признаки мошенничества.
ML разработчик
генерация резюме
сопроводительное письмо
описание
Компания строит набор продвинутых моделей реального времени для социальных ИИ, которые расширяют границы самовыражения, личности и реализма. Работа оживляет персонажей, меняя способы рассказывать истории, общаться и создавать контент. Флагманская платформа социального ИИ — только начало, за ней последует более широкая экосистема.
задачи
- Строить и поддерживать масштабные пайплайны для видео-датасетов: загрузка, парсинг, фильтрация, предобработка и курация (AWS S3, DynamoDB);
- Проектировать и запускать пайплайны аннотации (например, MTurk/Prolific): дизайн задач, контроль качества, валидация меток;
- Обучать и оценивать вспомогательные модели для фильтрации, оценки качества, предобработки или других этапов пайплайна;
- Сотрудничать с исследователями и инженерами, чтобы превращать экспериментальные пайплайны в масштабируемые, повторяемые системы для обучения и оценки;
- Улучшать качество данных от начала до конца: выявлять узкие места, сбои и слабые источники данных; строить инструменты и автоматизацию для упрощения создания датасетов;
- Работать в среде обучения на Kubernetes; оптимизировать скрипты инференса моделей для предобработки по скорости и стоимости в масштабе.
требования
- 3+ Года опыта в ML-инженерии, прикладном ML или пайплайнах данных (или родственных инженерных ролях);
- Сильные навыки Python и практический опыт построения надежных пайплайнов обработки данных для ML-воркфлоу;
- Опыт подготовки тренировочных данных в масштабе: парсинг, фильтрация, курация датасетов и контроль качества (например, S3/DynamoDB);
- Опыт работы с видео, компьютерным зрением, мультимодальными системами или генеративным видео;
- Опыт работы с Kubernetes для оркестрации распределенных нагрузок и доставки датасетов в кластеры обучения;
- Рабочие знания PyTorch и умение читать/дебаггить/оптимизировать исследовательский код инференса для предобработки;
- Будет плюсом опыт пайплайнов аннотации/лейблинга (крауд-платформы или вендоры), опыт обучения или дообучения моделей для фильтрации/ранжирования/оценки качества.
условия
- Полная занятость в инженерной команде;
- Конкурентная компенсация;
- Льготы: почти полное покрытие медстраховки/стоматологии/зрения, 42 дня оплачиваемого отпуска, декретный отпуск и поддержка фертильности, 401(k), 500$/месяц на стиль жизни и другие.
навыки