Oh! My Gadget!

Senior ML Engineer (ASR/TTS)

150 000 - 200 000 RUR
  • Москва
  • Частичная занятость
  • Удаленная работа
  • От 3 до 6 лет
  • Python
  • TTS
  • ASR

Senior ML Engineer (ASR/TTS), part‑time (4 часа/день)

О продукте. Мы строим голосового ИИ‑рекрутера: агент сам проводит короткие интервью‑скрининги, понимает кандидата в реальном времени и отвечает естественным «живым» голосом. Ниша быстро растёт; похожие решения (например, Mercor) уже подтверждают спрос рынком и инвестициями.

Образование и опыт

- Опыт работы с ASR и/или TTS системами (от 2–3 лет).

- Практический опыт внедрения и оптимизации моделей машинного обучения для обработки и генерации речи.

Задачи на роль (вы влияете на ядро продукта):

  • Спроектировать и запустить стриминговый ASR (RU/EN) с частичными гипотезами, устойчивостью к шуму/акцентам, прерываниям и корректным удержанием пунктуации.

  • Настроить TTS c «живой» просодикой (эмоции, темп, паузы), стриминговую генерацию и минимальную time‑to‑first‑audio (TTFT).

  • Добиться целевой E2E‑задержки разговорного цикла ≤ 500–700 мс при стабильном соединении.

  • Метрики/качество: WER/CER, MOS, RTTF; онлайн‑мониторинг и автотесты качества речи.

  • Инференс‑оптимизация: квантование/прунинг, ONNX Runtime/TensorRT, профилирование горячих путей.

Требования (must‑have):

  • Глубокие знания в области машинного обучения и глубоких нейронных сетей

  • Опыт работы с фреймворками PyTorch, TensorFlow, NumPy, SciPy

  • Опыт работы с инструментами и фреймворками для ASR/TTS (wav2vec2, Whisper, DeepSpeech, FastSpeech)

  • Опыт работы с NLP-пайплайнами: препроцессинг текста, нормализация, токенизация, языковые модели.

  • Понимание принципов работы стримингового распознавания речи.

  • Навыки оптимизации моделей, fine tuning.

  • Уверенные знания Python

  • Опыт работы с Docker / Kubernetes, CI/CD, MLOps.

Будет плюсом:

  • Опыт интеграции ASR/TTS в реальные продукты (чат-боты, голосовые ассистенты, мобильные приложения).

  • Навыки развертывания моделей в продакшене (REST/gRPC сервисы, оптимизация latency).

  • Способность работать как с исследовательскими задачами (R&D), так и с продакшн-развертыванием.

Условия:

  • График: 4 часа в день (удалённо), гибко по времени.

  • Оформление: обсуждаемо (самозанятость/ИП/ГПХ).

  • Оплата (0,5 ставки): от 150 000 до 200 000 ₽ «на руки» (Эквивалент 300–400 тыс. ₽ при full‑time).

  • Минимум бюрократии, продукт «с нуля» рядом с техлидом.

Как откликнуться: пришлите коротко (1) чем вы снижали latency в ASR/TTS, (2) пример метрик с последнего проекта (WER/MOS/RTTF), (3) ссылки на код/публикации/демо.