Если просят войти через iCloud, отправить коды из SMS, запустить код, что-то установить, перевести деньги или сделать что угодно, связанное с деньгами, не соглашайтесь: это признаки мошенничества.
Data Engineer
генерация резюме
сопроводительное письмо
описание
Строят и масштабируют пайплайны для сбора, обработки и фильтрации огромных мультимодальных датасетов (текст-видео-аудио триплеты, инструкции для редактирования), критически важных для обучения моделей.
задачи
- Разрабатывать ETL/ELT пайплайны для сбора и предобработки web-scale данных (видео, аудио, текст, метаданные);
- Создавать инфраструктуру для генерации синтетических инструкций для редактирования изображений/видео и синтетических описаний для изображений/видео/аудио;
- Обучать и внедрять VLM-based фильтры (например, на основе Qwen VL и пр.) для автоматической оценки качества, релевантности и безопасности данных;
- Строить систему дедупликации, кластеризации и балансировки мультимодальных датасетов;
- Оптимизировать хранение данных на удаленных хранилищах и потоковую передачу данных для ускорения обучения;
- Масштабировать пайплайны на распределенных кластерах.
требования
- Экспертиза в построении data pipelines (Python, SQL);
- Опыт обработки мультимодальных данных (особенно видео/аудио), кодеки, фреймворки (FFmpeg, librosa);
- Уверенное применение CV/VLM для фильтрации данных (PyTorch, Hugging Face Transformers);
- Опыт работы с распределенными вычислениями (Spark/Ray/Dask) и облачными хранилищами (S3, GCS);
- Знание практик data versioning (DVC) и управления метаданными;
- Навыки работы с генеративными AI-моделями; опыт создания AI-агентов и использования их в работе будет преимуществом.
условия
- Ежегодный пересмотр зарплаты, годовая премия;
- Корпоративный спортзал и зоны отдыха;
- Уникальная система обучения Сбера для профессионального развития;
- Расширенный ДМС и льготное страхование для семьи;
- Бесплатная подписка СберПрайм+, скидки на продукты компаний-партнеров;
- Вознаграждение за рекомендацию друзей в команду Сбера;
- Корпоративная пенсионная программа.
навыки