Uzinfocom
сегодня

Data Engineer

ниже рынка на 26,8%
вакансия 142 700 ₽
в среднем 194 833 ₽
мэтч
Добавь резюме в профиле, чтобы видеть % мэтча с вакансией

сопроводительное письмо

Добавь резюме в профиле, а нейросеть определит твою категорию. Затем ты сможешь генерировать сопроводительные письма для вакансий этой категории

описание

Нужен английский C1

UZINFOCOM создаёт и поддерживает государственные информационные системы как единый интегратор цифрового будущего Узбекистана. Команда проектирует и поддерживает конвейеры данных для развития речевых технологий в Muxlisa AI, обеспечивая чистые наборы данных для моделей распознавания речи, синтеза речи и диаризации.

задачи

  • Организовывать захват и загрузку аудиоданных из различных источников.
  • Собирать открытые датасеты с использованием Python, библиотек для веб-краулинга и кастомных парсеров.
  • Очищать и предобрабатывать звук (ресемплинг, VAD, удаление тишины, сегментацию).
  • Формировать выверенные пары «аудио-текст» для обучающих, валидационных и тестовых выборок.
  • Оптимизировать структуру данных и потоков в MinIO/S3.
  • Сопровождать процессы разметки (экспорт/импорт данных, валидация).
  • Создавать и поддерживать ETL-процессы для STT/TTS.
  • Подготавливать и поставлять данные для инженеров машинного обучения.

требования

  • Уверенно владеете Python (pandas, numpy, librosa, soundfile, re, pydub).
  • Имеете опыт работы в Linux/bash и обработки больших объёмов данных.
  • Понимаете основы обработки аудиосигналов.
  • Работали с объектными хранилищами (S3/MinIO).
  • Глубоко понимаете принципы структурирования данных: умеете сегментировать, категоризировать и размечать данные, проектировать схемы и обеспечивать консистентность форматов.
  • Знаете специфику форматов данных для STT/TTS.
  • Будет плюсом знакомство с инструментами оркестрации ETL (Airflow, Luigi), опыт работы с датасетами для диаризации речи.

условия

  • График 5/2 с 09:00 до 18:00.
  • Оформление по Трудовому кодексу РУз, 28 дней отпуска.
  • Нет строгого дресс-кода.
  • Работа в сильной команде с обменом знаниями.
  • Участие в крупных проектах для улучшения жизни населения и оптимизации бизнес-процессов.
  • Широкие возможности для самостоятельных решений и влияния на развитие компании.
  • Доступ к образовательным платформам, внутренние акселераторы роста, встречи с топами индустрии.
  • Комфортный офис, мероприятия, поддержка здоровья, лайфворк-баланс.
LinkedIn Добавить в отклики