Если просят войти через iCloud, отправить коды из SMS, запустить код, что-то установить, перевести деньги или сделать что угодно, связанное с деньгами, не соглашайтесь: это признаки мошенничества.
python developer
генерация резюме
сопроводительное письмо
описание
Описания нет
задачи
- Загружать и обрабатывать корпоративные документы: PDF, DOCX, XLSX, текстовые файлы;
- Настраивать извлечение текста, очистку, нормализацию и разбиение документов на смысловые фрагменты;
- Создавать embeddings для текстовых фрагментов и сохранять их в векторное хранилище;
- Настраивать семантический поиск по внутренним документам;
- Собирать простой RAG-пайплайн: вопрос пользователя → поиск релевантных фрагментов → ответ с опорой на найденный контекст;
- Тестировать качество ответов на типовых вопросах сотрудников;
- Улучшать структуру данных: добавлять метаданные, названия документов, разделы, страницы, источники;
- Документировать логику решения для дальнейшего развития проекта.
требования
- Базовое или уверенное владение Python;
- Понимание основ машинного обучения и обработки текстов;
- Опыт работы с текстовыми данными: очистка, разбиение, поиск, классификация или похожие задачи;
- Понимание, что такое embeddings и семантический поиск;
- Базовый опыт работы с Git;
- Готовность разбираться в LLM, RAG и векторных базах данных;
- Умение самостоятельно искать решения, читать документацию и доводить задачу до рабочего результата;
- Аккуратность в коде и документации;
- Будет плюсом опыт с LangChain или LlamaIndex, опыт с ChromaDB, FAISS, Qdrant или другой векторной базой, опыт работы с OpenAI API, GigaChat, YandexGPT, LLaMA, Mistral или другими LLM, опыт обработки PDF, DOCX, XLSX и OCR, базовое понимание REST API, опыт с Docker, опыт учебных проектов, pet-проектов или хакатонов по NLP, LLM, RAG.
условия
- Участие в реальном AI-проекте для промышленной компании;
- Возможность собрать MVP корпоративной базы знаний с нуля и получить практический опыт в RAG, LLM, embeddings и семантическом поиске;
- Задача, которую можно показать в портфолио без раскрытия конфиденциальных данных;
- Частичная занятость или проектный формат, возможное дальнейшее сотрудничество при успешном результате.
навыки