Если просят войти через iCloud, отправить коды из SMS, запустить код, что-то установить, перевести деньги или сделать что угодно, связанное с деньгами, не соглашайтесь: это признаки мошенничества.
machine learning engineer
генерация резюме
сопроводительное письмо
описание
С 2016 года Wallarm защищает критическую инфраструктуру интернета: API. Компания предоставляет единую платформу для полного жизненного цикла безопасности API — помогает командам обнаруживать поверхность атаки, защищаться от современных угроз и реагировать на инциденты в реальном времени. Строят системы обнаружения на базе машинного обучения, которые защищают API от автоматизированного злоупотребления, credential stuffing, скрапинга, перечислений и эволюционирующих паттернов атак.
задачи
- Построить ML-стек с нуля — спроектировать и реализовать пайплайны данных, извлечение признаков, обучение моделей и инфраструктуру для сервиса в продакшене для обнаружения аномалий;
- Обнаруживать аномалии в трафике API — построить систему, которая идентифицирует вредоносные поведенческие паттерны по сессиям клиентов с высокой точностью и полнотой, обученную на клиента;
- Владеть полным жизненным циклом — от исследования сырых данных и feature engineering до разработки моделей, оценки, деплоя и постоянного мониторинга;
- Проектировать эксперименты и метрики — строить оффлайн-оценки, определять метрики качества обнаружения и мониторить ложные срабатывания, дрейф и адаптацию атакующих;
- Работать с текстовыми и структурированными поведенческими данными — извлекать сигналы из сессий API, последовательностей запросов, пейлоудов и метаданных трафика с помощью NLP и статистических методов;
- Использовать LLM там, где они добавляют ценность — исследовать модели на эмбеддингах и подходы с LLM для обогащения сигналов, классификации и объяснимости;
- Формировать техническое направление — документировать находки, презентовать кросс-функциональным командам и помогать определять roadmap ML по мере роста команды.
требования
- 5+ Лет в прикладном ML или ML-инженерии с опытом деплоя в продакшен (не только исследования);
- Сильный опыт с NLP / текстовыми данными — работа с классификацией текста, извлечением паттернов, токенизацией, эмбеддингами или подобным;
- Владение Python и продакшен-системами (API, пайплайны данных, сервисы моделей);
- Навыки data engineering — опыт построения ETL/пайплайнов данных, работа с батчевыми и стриминговыми данными, понимание полного ML-цикла данных (DAG, версионирование данных, feature stores);
- Глубокий hands-on опыт по основам ML: классификация, обнаружение аномалий, кластеризация, статистические методы — и умение выбирать подход под задачу;
- Умение работать с неидеальными данными — noisy labels, дисбаланс классов, эволюционирующие распределения — и стратегии для разметки, оценки и релиза надежных моделей;
- End-to-end ownership — способность вести проблему от сырых данных до продакшена, работая с DevOps над инфраструктурой;
- Сильные навыки экспериментов: быстро прототипировать, проектировать строгие оценки, измерять результаты, взвешивать trade-offs (стоимость, качество, латентность);
- Будет плюсом опыт в доменах с адаптирующимися adversaries (fraud, bot mitigation, abuse prevention, spam), familiarity с ML lifecycle tooling (MLflow, W&B, DVC, Snorkel, cleanlab, drift monitoring), опыт с big data / streaming stacks (Spark, Kafka, BigQuery) или cloud ML platforms (AWS SageMaker, GCP Vertex), background в security research или threat intelligence.
условия
- Условий в вакансии нет
навыки