Яндекс Поиск
25 окт

ML Engineer

выше рынка на 28,6%
вакансия ~ 301 000 ₽
в среднем 234 000 ₽
мэтч
Загрузи резюме в профиле, чтобы видеть % мэтча с вакансией

сопроводительное письмо

Загрузи резюме в профиле, а нейросеть определит твою категорию. Затем ты сможешь генерировать сопроводительные письма для вакансий этой категории

описание

Компания создаёт инфраструктуру для обучения больших языковых (LLM) и визуально-языковых (VLM) моделей. Эти модели используются в Алисе, Поиске и других сервисах Яндекса. Обучение таких моделей — это сложная система из тысяч серверов и миллионов ядер. Задача команды — сделать эту систему максимально эффективной, правильно используя ресурсы и снижая риски сбоев.

Вам нужно будет улучшать ключевые части инфраструктуры RL-обучения: оптимизировать доставку и сохранение данных, а также коммуникации между блоками обучения. Вы будете создавать инструменты для быстрой диагностики проблем и повышать устойчивость системы к сбоям. Также предстоит изучать новые подходы к организации инфраструктуры и внедрять их в проекты.

требования

  • Знаете Python и имеете опыт системного программирования, разработки библиотек или фреймворков
  • Хорошо знакомы и работали на практике с фреймворком PyTorch и распределённым обучением через torch.distributed
  • Владеете подходами параллелизации: понимаете data parallelism, tensor parallelism, pipeline parallelism, expert parallelism для распределённого инференса или обучения
  • Интересуетесь LLM и MLOps: понимаете задачи и сложности эксплуатации больших моделей в продакшне
  • Умеете эффективно работать в команде и делиться знаниями
  • Имеете опыт участия в создании инфраструктуры обучения ML-моделей (Будет плюсом)
  • Имеете опыт внедрения и оптимизации RL-решений (Будет плюсом)
  • Работали с библиотеками RL-обучения для LLM: veRL, slime, NeMo-RL, SkyRL и другими, а также с библиотеками инференса: vLLM, SGLang и TRTLLM (Будет плюсом)
  • Владеете C++ и имеете опыт низкоуровневого программирования и оптимизации (Будет плюсом)
  • Имеете опыт с GPU NVIDIA: понимаете архитектуру GPU, разрабатывали или оптимизировали алгоритмы с использованием CUDA или Triton (Будет плюсом)

условия

  • Расширенная медицинская страховка с первого месяца, включая стоматологию, чекапы, неотложную помощь за рубежом и лечение критических заболеваний
  • Психотерапия в офисе или онлайн
  • Лазерная коррекция зрения через год работы
  • Ведение беременности и роды через два года работы
  • Страховка для родственников по системе 80/20
  • Доступ к внутренней образовательной платформе, менторство и программы развития
  • Оплата участия в профильных конференциях
  • Спортивные залы во всех крупных офисах и скидки в фитнес-клубах
  • Спортивный клуб Яндекса и возможность участвовать в соревнованиях
  • Гибкий график начала и конца рабочего дня
  • Жилищные займы по льготной ставке для сотрудников в российских офисах
  • Поддержка для детей: страхование, детские дни в офисе, подарки на рождение и чекапы при планировании беременности
Откликнуться Добавить в отклики