Инженер данных
генерация резюме под вакансию
сопроводительное письмо
описание
Описания нет
задачи
- Подготавливать данные для валидации: собирать выборки, целевые переменные и признаки из распределённых хранилищ данных;
- Формировать и проверять наборы данных;
- Проверять качество данных на наличие дубликатов, пропусков, выбросов и смещений распределений;
- Анализировать датасеты на соответствие техническим и бизнес-требованиям;
- Участвовать в валидации моделей различных продуктов;
- Поддерживать ветки валидации с разной логикой сбора данных и таргетов.
требования
- Опыт работы с SQL и Impala, включая написание сложных запросов и оптимизацию;
- Опыт работы с Hadoop и Spark с большими объёмами данных;
- Знание базовых статистических метрик для моделей (KS, PSI, GINI, AUC, IV);
- Опыт обработки и подготовки данных с использованием pandas и PySpark;
- Опыт работы с Jupyter Notebook;
- Базовое понимание ML-моделей (классификация, регрессия, калибровка);
- Готовность работать с регуляторной документацией.
условия
- Стабильный и прозрачный доход;
- Корпоративные и внешние программы обучения;
- Программа ДМС со стоматологией и обслуживанием в клиниках;
- Скидки на фитнес, путешествия, продукты питания, рестораны, бары, магазины и салоны красоты;
- Льготные условия обслуживания на банковские карты;
- Программа развития AI-грамотности.
навыки
Если просят войти через iCloud, отправить коды из SMS, запустить код, что-то установить, перевести деньги или сделать что угодно, связанное с деньгами, не соглашайтесь: это признаки мошенничества.