machine learning engineer
сопроводительное письмо
описание
Команда строит корпоративного помощника на базе ИИ, который помогает организациям мгновенно и безопасно получать доступ к своим знаниям. Система сочетает Retrieval-Augmented Generation, мультитенантную архитектуру и защищённые облачные компоненты для точных ответов в сложных корпоративных средах. Вам нужно будет проектировать, улучшать и поддерживать интеллектуальный слой платформы, включая доработку существующих пайплайнов RAG на Python для индексации, эмбеддингов, поиска и ранжирования, внедрение улучшений векторных баз данных, создание пайплайнов предобработки документов для разных форматов, интеграцию и оптимизацию промптов с моделями OpenAI, эксперименты с альтернативными LLM, разработку guardrails и метрик оценки, работу с инженером AWS по деплою и масштабированию сервисов RAG, реализацию безопасных потоков данных, дизайн мультитенантных и on-prem версий архитектуры, оценку новых моделей эмбеддингов и стратегий поиска, улучшение семантического поиска и исследование новых техник.
требования
- Отличные навыки Python для быстрого чистого продакшн-кода.
- Практический опыт работы с LLM вроде OpenAI API.
- Обширный опыт с системами RAG и векторными базами данных вроде Qdrant, Pinecone, FAISS.
- Знание AWS вроде Lambda, S3, EC2, IAM, CloudWatch, API Gateway.
- Опыт извлечения данных из документов вроде OCR, парсинга PDF, пайплайнов.
- Понимание эмбеддингов, семантического поиска и prompt engineering.
- Умение доводить фичу от идеи до деплоя.
- Будет плюсом эксперименты с альтернативными LLM, исследования rerankers, hybrid search и small local LLMs.
условия
- Работа напрямую с основателями над высоковоздействующим продуктом ИИ.
- Современный стек: Python, OpenAI, AWS, Qdrant, FastAPI с возможностью его развивать.
- Высокая автономия и влияние на архитектуру продукта.
- Возможность работать на передовой enterprise AI и RAG-систем.
навыки