CRT
9 янв

ML Engineer

ниже рынка на 14,5%
вакансия 200 000 ₽
в среднем 234 000 ₽
мэтч
Добавь резюме в профиле, чтобы видеть % мэтча с вакансией

сопроводительное письмо

Добавь резюме в профиле, а нейросеть определит твою категорию. Затем ты сможешь генерировать сопроводительные письма для вакансий этой категории

описание

Компания занимается разработкой сервиса по быстрому и качественному созданию презентационных материалов, система работает с высокими нагрузками и ежедневно обслуживает около 20 000 пользователей. Вам нужно будет разворачивать и поддерживать LLM-модели в корпоративном контуре на базе Qwen, Llama, Mistral и аналогов, проектировать и реализовывать RAG-системы, интегрировать LLM в основной продукт — редактор презентаций, выполнять дообучение LLM-моделей методом LoRA или QLoRA, оптимизировать запросы к модели для снижения количества токенов, писать и поддерживать техническую документацию.

требования

  • Коммерческий опыт разработки на Python на уровне middle или выше
  • Опыт развёртывания LLM-моделей в локальном или корпоративном контуре
  • Опыт дообучения LLM-моделей методами LoRA или QLoRA
  • Практический опыт проектирования и внедрения RAG-систем
  • Уверенная работа с Git в командной разработке
  • Будет плюсом опыт работы с vLLM, TGI, Ollama, HuggingFace Inference, работа с векторными базами Qdrant, Milvus, Weaviate, опыт оптимизации производительности LLM-сервисов, базовое понимание Docker, Linux и GPU-окружения

условия

  • Официальное трудоустройство в аккредитованную IT-компанию
  • График 5/2 с возможностью гибкого начала и окончания дня
  • Полностью официальная зарплата без задержек, с плановым увеличением в течение 2 лет
  • Выплаты два раза в месяц
Откликнуться на hh Добавить в отклики