Decart IT-production
29 янв

data engineer

выше рынка на 43,2%
вакансия 279 000 ₽
в среднем 194 833 ₽
мэтч
Добавь резюме в профиле, чтобы видеть % мэтча с вакансией

сопроводительное письмо

Добавь резюме в профиле, а нейросеть определит твою категорию. Затем ты сможешь генерировать сопроводительные письма для вакансий этой категории

описание

Команда разрабатывает пайплайны и решения для обработки данных. Вам нужно будет проектировать и разрабатывать ETL/ELT-пайплайны для подготовки данных транзакций, клиентского поведения и внешних источников, строить стриминговые решения для обработки транзакций в реальном времени, обеспечивать качество данных через валидацию, мониторинг аномалий и автоматическое тестирование датасетов, оптимизировать хранилище данных для быстрого доступа команд машинного обучения, создавать версионированные датасеты для обучения и тестирования моделей, автоматизировать процессы через CI/CD, контейнеризацию и оркестрацию.

требования

  • Уверенно владеете Python и SQL для разработки пайплайнов
  • Есть опыт построения ETL/ELT-процессов в продакшене
  • Работали с Airflow или похожими оркестраторами
  • Понимаете принципы моделирования данных (звёздная схема, нормализация)
  • Опыт с одним из облачных хранилищ данных: BigQuery, Snowflake или Redshift
  • Будет плюсом dbt, Spark, Kafka, Kinesis, Flink, Parquet, ORC, S3, GCS, Great Expectations, оптимизация запросов через партиционирование и индексацию, Docker, Git, CI/CD, системы мониторинга

условия

  • Выбирайте проекты и заказчиков под себя: громкие имена, интересные задачки или спокойный режим
  • Оформление по удобному формату (ИП, самозанятость)
  • Регулярный пересмотр ставки
  • График сам выбираете, главное — пересечение с командой по времени (5/2, фуллтайм или парттайм, гибкое начало)
  • Можно совмещать проекты и работать откуда угодно при тишине и интернете
Email Добавить в отклики