ML разработчик
генерация резюме под вакансию
сопроводительное письмо
описание
Команда Поиска создает поисковый движок, который позволяет ассистенту на устройствах находить треки, исполнителей, плейлисты и подкасты.
задачи
- Участвовать в улучшении качества поиска: от офлайн-метрик ранжирования до стабильности ранжирования в проде;
- Разрабатывать и внедрять модели ранжирования Learning to Rank для повышения релевантности поисковой выдачи;
- Обучать и улучшать LTR-модели на базе классического ML и градиентного бустинга: CatBoost, LightGBM или XGBoost;
- Работать с BERT/NLP-моделями для векторизации запросов, документов и объектов музыкального каталога;
- Развивать гибридный retrieval-пайплайн: lexical search на базе OpenSearch/Elasticsearch, dense retrieval на BERT/Transformer-эмбеддингах и ML-reranking на LTR-моделях;
- Участвовать в обновлении и перестроении индекса для улучшения качества и скорости поиска;
- Разрабатывать запросно-независимые и запросно-зависимые фичи для ранжирования, персонализирующие фичи на основе действий пользователя, истории прослушиваний, кликов, пропусков, лайков и других сигналов;
- Развивать пайплайны оценки и переоценки качества поиска;
- Готовить обучающие датасеты для ранжирования на основе логов, кликов, прослушиваний, ручной разметки и implicit feedback;
- Участвовать в A/B-тестах поисковых изменений и анализе результатов;
- Развивать ML-пайплайны в Airflow;
- Работать с большими объёмами логов и фичей с использованием PySpark;
- Взаимодействовать с командой инфраструктуры при внедрении моделей ранжирования и новых фичей в production.
требования
- Практический опыт в задачах ранжирования, поиска, рекомендаций или NLP от 3 лет;
- Опыт работы с классическим ML и градиентным бустингом: CatBoost, LightGBM или XGBoost;
- Опыт feature engineering для задач ранжирования, поиска или рекомендаций;
- Опыт работы с BERT/Transformer-моделями для NLP-задач: эмбеддинги, семантический поиск, matching query-document или reranking;
- Понимание принципов lexical search, dense retrieval и ML-reranking;
- Понимание, какие метрики применять в разных классах поисковых задач;
- Опыт работы с Airflow или другими оркестраторами задач для ML/data-пайплайнов;
- Опыт работы с большими данными: PySpark, SQL или аналогичные инструменты;
- Уверенное владение Python, умение писать читаемый и поддерживаемый код;
- Будет плюсом опыт production-эксплуатации моделей ранжирования, опыт построения гибридного или векторного поиска, опыт с retrieval-частью RAG-систем, опыт A/B-тестирования и оценки качества поиска, понимание типов событий и логов вокруг поиска, опыт работы с OpenSearch/Elasticsearch в highload-системах, опыт работы с векторным поиском и ANN-индексами, опыт построения мониторинга и алертинга для ML-моделей, опыт анализа деградации качества ранжирования в проде.
условия
- Ежегодный пересмотр зарплаты, годовой бонус;
- Корпоративный спортзал и зоны отдыха;
- Более 400 образовательных программ СберУниверситета для профессионального и карьерного развития;
- Расширенный ДМС, льготное страхование для семьи и корпоративная пенсионная программа;
- Гибкий дисконт по ипотечному кредиту, равный 1/3 ключевой ставки ЦБ;
- Бесплатная подписка СберПрайм+, скидки на продукты компаний-партнеров;
- Вознаграждение за рекомендацию друзей в команду Сбера.
навыки
Если просят войти через iCloud, отправить коды из SMS, запустить код, что-то установить, перевести деньги или сделать что угодно, связанное с деньгами, не соглашайтесь: это признаки мошенничества.