ML разработчик

выше рынка на 15,6%

вакансия 232 722 ₽

в среднем 201 398 ₽

мэтч

Загрузи резюме, чтобы видеть мэтчи с вакансией

генерация резюме под вакансию

Загрузи резюме в профиль, чтобы сгенерировать временное CV под эту вакансию

сопроводительное письмо

Загрузи резюме в профиль, а нейросеть определит твою категорию. Затем ты сможешь генерировать сопроводительные письма для вакансий этой категории

описание

Команда Поиска создает поисковый движок, который позволяет ассистенту на устройствах находить треки, исполнителей, плейлисты и подкасты.

задачи

Участвовать в улучшении качества поиска: от офлайн-метрик ранжирования до стабильности ранжирования в проде;
Разрабатывать и внедрять модели ранжирования Learning to Rank для повышения релевантности поисковой выдачи;
Обучать и улучшать LTR-модели на базе классического ML и градиентного бустинга: CatBoost, LightGBM или XGBoost;
Работать с BERT/NLP-моделями для векторизации запросов, документов и объектов музыкального каталога;
Развивать гибридный retrieval-пайплайн: lexical search на базе OpenSearch/Elasticsearch, dense retrieval на BERT/Transformer-эмбеддингах и ML-reranking на LTR-моделях;
Участвовать в обновлении и перестроении индекса для улучшения качества и скорости поиска;
Разрабатывать запросно-независимые и запросно-зависимые фичи для ранжирования, персонализирующие фичи на основе действий пользователя, истории прослушиваний, кликов, пропусков, лайков и других сигналов;
Развивать пайплайны оценки и переоценки качества поиска;
Готовить обучающие датасеты для ранжирования на основе логов, кликов, прослушиваний, ручной разметки и implicit feedback;
Участвовать в A/B-тестах поисковых изменений и анализе результатов;
Развивать ML-пайплайны в Airflow;
Работать с большими объёмами логов и фичей с использованием PySpark;
Взаимодействовать с командой инфраструктуры при внедрении моделей ранжирования и новых фичей в production.

требования

Практический опыт в задачах ранжирования, поиска, рекомендаций или NLP от 3 лет;
Опыт работы с классическим ML и градиентным бустингом: CatBoost, LightGBM или XGBoost;
Опыт feature engineering для задач ранжирования, поиска или рекомендаций;
Опыт работы с BERT/Transformer-моделями для NLP-задач: эмбеддинги, семантический поиск, matching query-document или reranking;
Понимание принципов lexical search, dense retrieval и ML-reranking;
Понимание, какие метрики применять в разных классах поисковых задач;
Опыт работы с Airflow или другими оркестраторами задач для ML/data-пайплайнов;
Опыт работы с большими данными: PySpark, SQL или аналогичные инструменты;
Уверенное владение Python, умение писать читаемый и поддерживаемый код;
Будет плюсом опыт production-эксплуатации моделей ранжирования, опыт построения гибридного или векторного поиска, опыт с retrieval-частью RAG-систем, опыт A/B-тестирования и оценки качества поиска, понимание типов событий и логов вокруг поиска, опыт работы с OpenSearch/Elasticsearch в highload-системах, опыт работы с векторным поиском и ANN-индексами, опыт построения мониторинга и алертинга для ML-моделей, опыт анализа деградации качества ранжирования в проде.

условия

Ежегодный пересмотр зарплаты, годовой бонус;
Корпоративный спортзал и зоны отдыха;
Более 400 образовательных программ СберУниверситета для профессионального и карьерного развития;
Расширенный ДМС, льготное страхование для семьи и корпоративная пенсионная программа;
Гибкий дисконт по ипотечному кредиту, равный 1/3 ключевой ставки ЦБ;
Бесплатная подписка СберПрайм+, скидки на продукты компаний-партнеров;
Вознаграждение за рекомендацию друзей в команду Сбера.

навыки

python ml catboost lightgbm xgboost bert nlp airflow pyspark sql opensearch elasticsearch learning to highload

Если просят войти через iCloud, отправить коды из SMS, запустить код, что-то установить, перевести деньги или сделать что угодно, связанное с деньгами, не соглашайтесь: это признаки мошенничества.

зарплата по оценке AI

Добавить в трекер

Откликнуться В трекер