C++ Developer
генерация резюме под вакансию
сопроводительное письмо
описание
Команда создает решения для обеспечения доступности и стабильности сервиса инференса больших языковых моделей в условиях высокой нагрузки, сетевых задержек и возможных сбоев оборудования.
задачи
- Оптимизировать инференсные движки для повышения эффективности и снижения задержек при выполнении инференса на GPU;
- Создавать и улучшать инструменты для оперативного выявления и устранения инфраструктурных проблем, влияющих на стабильность и скорость работы;
- Исследовать и внедрять методы оптимизации инференса, включая квантование, прунинг и современные подходы к параллелизации.
требования
- Уверенное владение C++ и Python, навыки низкоуровневого программирования и оптимизации;
- Опыт работы с GPU NVIDIA и архитектурой CUDA, разработка или оптимизация алгоритмов под CUDA;
- Глубокое понимание архитектуры Transformer, включая механизмы attention, FFN и нормализации;
- Знание подходов к распределённому инференсу или обучению, включая Data Parallel, Tensor Parallel, Pipeline Parallel;
- Понимание задач и вызовов эксплуатации больших моделей в продакшне;
- Навыки эффективной командной работы и обмена знаниями;
- Будет плюсом опыт работы с современными решениями для оптимизации инференса: vLLM, TensorRT-LLM или sglang.
условия
- Расширенная медицинская страховка с первого месяца, включая стоматологию, чекапы и помощь за рубежом;
- Страхование родственников по системе 80/20;
- Доступ к внутренней образовательной платформе, менторству и оплата участия в профильных конференциях;
- Наличие спортзалов в крупных офисах, корпоративные тренеры и скидки в фитнес-клубы;
- Гибкий график работы;
- Льготные жилищные займы для сотрудников российских офисов;
- Программы поддержки для родителей: страхование детей, подарки на рождение и детские дни в офисе.
навыки
Если просят войти через iCloud, отправить коды из SMS, запустить код, что-то установить, перевести деньги или сделать что угодно, связанное с деньгами, не соглашайтесь: это признаки мошенничества.