Если просят войти через iCloud, отправить коды из SMS, запустить код, что-то установить, перевести деньги или сделать что угодно, связанное с деньгами, не соглашайтесь: это признаки мошенничества.

сегодня

C++ Developer

выше рынка на 8,6%
вакансия 336 000 ₽
в среднем 309 456 ₽
мэтч
Добавь резюме в профиле, чтобы видеть % мэтча с вакансией

генерация резюме

Добавьте резюме в профиль, чтобы сгенерировать временное CV под эту вакансию

сопроводительное письмо

Добавь резюме в профиле, а нейросеть определит твою категорию. Затем ты сможешь генерировать сопроводительные письма для вакансий этой категории

описание

Команда разрабатывает высоконагруженные сервисы распознавания (ASR) и синтеза речи (TTS), работающие в Алисе, Браузере, Переводчике и других продуктах Яндекса. Команда отвечает за бэкенд-инфраструктуру этих технологий: от проектирования и разработки gRPC-сервисов до оптимизации инференса современных нейросетевых моделей.

задачи

  • Внедрять новые модели синтеза и распознавания речи;
  • Работать с ML-командами, понимать архитектуру моделей (TTS, ASR), проектировать схемы инференса и адаптировать сервисы под них;
  • Разрабатывать высоконагруженные gRPC-сервисы с нуля на C++;
  • Оптимизировать инференс нейросетей;
  • Исследовать и внедрять движки инференса (vLLM, SGLang, TensorRT-LLM), экспериментировать с батчингом, квантованием и кешированием;
  • Повышать надёжность сервисов;
  • Участвовать в полном цикле разработки — от проектирования и тестирования до деплоя и поддержки;
  • Улучшать мониторинг, добавлять метрики и логи, автоматизировать релизы.

требования

  • Уверенно владеете C++, желательно C++17 и выше;
  • Разрабатывали высоконагруженные бэкенд-сервисы: умеете проектировать системы с предсказуемым latency, стабильным throughput, находить и устранять утечки памяти и деградацию производительности под нагрузкой;
  • Имеете базовые знания в области ML и знакомы с PyTorch;
  • Будет плюсом знакомство с современными фреймворками для инференса LLM-моделей (SGLang, vLLM, TensorRT-LLM), работа с GPU NVIDIA (понимание архитектуры GPU, разработка или оптимизация алгоритмов с использованием CUDA или Triton).

условия

  • Расширенная медицинская страховка с первого месяца (стоматология, чекапы, неотложная помощь за рубежом, лечение онкологии, страхование от несчастных случаев);
  • Психотерапия в офисе или онлайн, лазерная коррекция зрения через год, ведение беременности и роды через два года;
  • Страховка для родственников по системе 80/20;
  • Внутренняя образовательная платформа, менторство, программы для руководителей, оплата конференций;
  • Спортзалы в офисах, скидки в фитнес-клубах, бассейнах, йоге, скалодромах;
  • Спортивный клуб и команды Яндекса;
  • Гибкий график;
  • Льготные жилищные займы для сотрудников российских офисов;
  • Страхование для детей, детские дни в офисе, подарки на рождение детей.

прозрачные зарплаты в IT

Анонимные данные по зарплатам и грейдам

Посмотреть
График динамики зарплат
Откликнуться Добавить в отклики

Если просят войти через iCloud, отправить коды из SMS, запустить код, что-то установить, перевести деньги или сделать что угодно, связанное с деньгами, не соглашайтесь: это признаки мошенничества.