NDA
сегодня

data engineer

выше рынка на 21,8%
вакансия 245 843 ₽
в среднем 201 880 ₽
Загрузи резюме, чтобы видеть мэтчи с вакансией
Загрузить

генерация резюме под вакансию

Загрузи резюме в профиль, чтобы сгенерировать временное CV под эту вакансию
Загрузить

сопроводительное письмо

Загрузи резюме в профиль, а нейросеть определит твою категорию. Затем ты сможешь генерировать сопроводительные письма для вакансий этой категории
Загрузить

описание

Команда занимается разработкой data lakehouse-решения для крупного заказчика, работая с большими объёмами данных в рамках многоуровневой архитектуры.

задачи

  • Разрабатывать и оптимизировать ETL/ELT-пайплайны под большие объёмы данных;
  • Парсить, валидировать и трансформировать XML-данные;
  • Строить слои raw, processed и curated с использованием Parquet и S3;
  • Реализовывать нормализацию, дедупликацию и формирование «золотых» записей;
  • Тюнить производительность и обеспечивать стабильность в продакшене;
  • Подготавливать решения к переносу в закрытый контур заказчика;
  • Взаимодействовать с аналитиками, архитектором, DevOps и командой.

требования

  • Уверенное владение Python, понимание ООП, типизации и работы с памятью;
  • Коммерческий опыт работы от 3 лет, включая 1–2 года поддержки ETL/ELT-пайплайнов в продакшене;
  • Опыт работы с PySpark, pandas или аналогами, а также с большими объёмами данных;
  • Понимание форматов Parquet, columnar storage, partitioning, compression и schema evolution;
  • Опыт работы с S3 или аналогами;
  • Понимание архитектур Data Lake и Lakehouse, включая многоуровневые слои данных;
  • Навыки обеспечения качества данных: нормализация, дедупликация, формирование golden record;
  • Продвинутые знания SQL и баз данных: PostgreSQL, Greenplum, ClickHouse, оконные функции, CTE, оптимизация запросов;
  • Опыт работы с оркестраторами: Apache Airflow или аналоги;
  • Знание DevOps-инструментов: Docker, CI/CD, Git;
  • Понимание работы облачных сервисов: IAM, сети, compute, storage;
  • Опыт парсинга и валидации XML;
  • Будет плюсом глубокая оптимизация Apache Spark, знание Trino, Presto, табличных форматов Apache Iceberg, Delta Lake, Hudi, опыт работы в закрытых контурах, знание концепций Data Mesh, Data Fabric, опыт написания unit и integration тестов.

условия

  • Условий в вакансии нет

Если просят войти через iCloud, отправить коды из SMS, запустить код, что-то установить, перевести деньги или сделать что угодно, связанное с деньгами, не соглашайтесь: это признаки мошенничества.

прозрачные зарплаты в IT

Анонимные данные по зарплатам и грейдам

Посмотреть
График динамики зарплат
Telegram Добавить в отклики

Если просят войти через iCloud, отправить коды из SMS, запустить код, что-то установить, перевести деньги или сделать что угодно, связанное с деньгами, не соглашайтесь: это признаки мошенничества.