Если просят войти через iCloud, отправить коды из SMS, запустить код, что-то установить, перевести деньги или сделать что угодно, связанное с деньгами, не соглашайтесь: это признаки мошенничества.

сегодня

nlp engineer

выше рынка на 13,2%
вакансия 317 000 ₽
в среднем 280 008 ₽
мэтч
Добавь резюме в профиле, чтобы видеть % мэтча с вакансией

генерация резюме

Добавьте резюме в профиль, чтобы сгенерировать временное CV под эту вакансию

сопроводительное письмо

Добавь резюме в профиле, а нейросеть определит твою категорию. Затем ты сможешь генерировать сопроводительные письма для вакансий этой категории

описание

Команда GigaChat Pretrain Data готовит pretrain данные для GigaChat и GigaChat Vision. Pretrain данные - это фундамент, с которого начинается путь современной LLM модели и то, от чего наиболее зависит ее итоговое качество. Сырых данных более 40Пб и основная задача заключается в том, чтобы из этого хаоса сделать датасет, на котором будет обучена лучшая LLM в России.

задачи

  • Генерировать синтетические данные: математика, код, произвольная синтетика с сидами - документами из Web;
  • Исследовать токенизацию и ее влияние на качество модели (возможно написание статей);
  • Решать задачи кластеризации миллиардов документов;
  • Исследовать разные факторы, которыми обладают текстовые данные;
  • Генерировать Vision данные для прокачки VLM;
  • Разрабатывать новые алгоритмы парсинга HTML и исследовать его влияние на качество модели;
  • Исследовать зависимости между pretrain данными и agentic capabilities итоговой модели;
  • Разрабатывать стабильную инфраструктуру, которая будет поддерживать проведение сотен и тысяч экспериментов над данными.

требования

  • Имеешь коммерческий релевантный опыт связанный с NLP или построением инфраструктуры для данных от двух лет;
  • Будет плюсом навыки работы с генеративными AI-моделями, опыт создания AI-агентов и использования их в работе, опыт использования GigaChat, Kandinsky и аналогов в продуктах, навыки создания и использования AI-агентов, инструментальное владение AI для анализа, генерации и автоматизации, опыт с MapReduce системами.

условия

  • Комфортный современный офис рядом с м. Кутузовская;
  • Ежегодный пересмотр зарплаты, годовая премия;
  • Корпоративный спортзал и зоны отдыха;
  • Система обучения для профессионального и карьерного развития;
  • Расширенный полис ДМС с первого дня работы и страхование для семьи;
  • Льготная программа ипотеки для сотрудников;
  • Бесплатная подписка СберПрайм+, скидки на продукты компаний-партнеров;
  • Вознаграждение за рекомендацию друзей в команду Сбера.

прозрачные зарплаты в IT

Анонимные данные по зарплатам и грейдам

Посмотреть
График динамики зарплат
Откликнуться Добавить в отклики

Если просят войти через iCloud, отправить коды из SMS, запустить код, что-то установить, перевести деньги или сделать что угодно, связанное с деньгами, не соглашайтесь: это признаки мошенничества.