Инженер данных
сопроводительное письмо
описание
RounDC — это сервис автоматизированного подбора инвесторов для стартапов. Сервис забирает данные из Telegram/WhatsApp, обогащает их при помощи LLM и строит умный матчинг стартапов и фондов/ангелов поверх собственной CRM.
задачи
- Проектировать и развивать сервис матчинга стартапов и инвесторов на основе эмбеддингов, правил и инструментов вроде Splink.
- Настраивать entity resolution / deduplication для баз людей и компаний в CRM.
- Интегрировать ML‑логику с текущим стеком (Python, LLM API, CRM, Elasticsearch).
- Вводить метрики качества (precision/recall, hit‑rate и др.), улучшать качество матчинга по фидбеку пользователей.
требования
- Сильный Python, желателен опыт продового кода для data/ML‑задач.
- Практический опыт с текстовыми эмбеддингами и векторным поиском.
- Опыт в entity matching / deduplication (fuzzy matching, record linkage; Splink или аналоги).
- Уверенный SQL и опыт работы с прикладными базами (CRM, OLTP‑схемы).
- Понимание, как доводить ML‑решения до продакшена: API‑сервисы, очереди/стриминг, логирование, мониторинг.
- Будет плюсом опыт с Elasticsearch или другим поисковым движком, опыт интеграции с мессенджерами или high‑load data ingestion, опыт в рекомендательных системах или продуктовом data science
условия
- Частичная занятость
навыки