Инженер данных
сопроводительное письмо
описание
Команда разрабатывает аналитическую платформу. Одна из задач команды — объединить аналитику, обучение моделей и их внедрение в продукт для различных команд Авиасейлс на базе дата платформы. Цель — создать универсальную структуру, которая позволит эффективно интегрировать разные модели.
задачи
- Проектировать и сопровождать дата пайплайны, необходимые для работы МЛ платформы.
- Разрабатывать и поддерживать офлайн (batch) сервисы обучения и инференса ML-моделей.
- Деплоить модели в продакшн, обеспечивать их стабильность работы и масштабируемость, разрабатывать систему мониторинга.
- Анализировать качество моделей.
- Сотрудничать с разными командами разработки и аналитики для интеграции моделей в прод.
требования
- Опыт работы в Data Engineering/ML не менее 3 лет.
- Уверенное владение SQL, Python.
- Понимание Lakehouse концепций.
- Опыт работы с построением моделей (линейные/деревянные модели, ансамбли) для разных задач (регрессия, классификация, кластеризация, временные ряды).
- Навыки работы с контейнерами (Docker, Kubernetes), CI/CD (Jenkins), мониторингом (Prometheus, Grafana).
- Желание и способность работать в команде, обмениваться знаниями и опытом.
- Будет плюсом опыт с Apache Airflow, DBT, Apache Spark, Trino, Kafka, ClickHouse, S3, MLFlow, умение анализировать качество моделей с использованием различных классических и кастомных метрик, опыт работы с большими объемами данных и оптимизацией производительности моделей.
условия
- Работа в любой точке мира.
- Платят в долларах.
- Без бюрократии, удобные процессы, горизонтальные и открытые коммуникации.
- Компенсируют ДМС, психотерапию или иностранные языки, занятия спортом и больничный.
- Можно работать на Пхукете с видом на океан.
- Топовая команда, вечеринки с бассейном, котики в офисе, сырки на любой вкус в холодильнике.
- Помогают подтянуть английский язык.
- Детское обучение: помогают с оплатой садика и школы для твоих детей.
навыки