Senior ML Engineer (ASR/TTS), part‑time (4 часа/день)
О продукте. Мы строим голосового ИИ‑рекрутера: агент сам проводит короткие интервью‑скрининги, понимает кандидата в реальном времени и отвечает естественным «живым» голосом. Ниша быстро растёт; похожие решения (например, Mercor) уже подтверждают спрос рынком и инвестициями.
Образование и опыт
- Опыт работы с ASR и/или TTS системами (от 2–3 лет).
- Практический опыт внедрения и оптимизации моделей машинного обучения для обработки и генерации речи.
Задачи на роль (вы влияете на ядро продукта):
-
Спроектировать и запустить стриминговый ASR (RU/EN) с частичными гипотезами, устойчивостью к шуму/акцентам, прерываниям и корректным удержанием пунктуации.
-
Настроить TTS c «живой» просодикой (эмоции, темп, паузы), стриминговую генерацию и минимальную time‑to‑first‑audio (TTFT).
-
Добиться целевой E2E‑задержки разговорного цикла ≤ 500–700 мс при стабильном соединении.
-
Метрики/качество: WER/CER, MOS, RTTF; онлайн‑мониторинг и автотесты качества речи.
-
Инференс‑оптимизация: квантование/прунинг, ONNX Runtime/TensorRT, профилирование горячих путей.
Требования (must‑have):
-
Глубокие знания в области машинного обучения и глубоких нейронных сетей
-
Опыт работы с фреймворками PyTorch, TensorFlow, NumPy, SciPy
-
Опыт работы с инструментами и фреймворками для ASR/TTS (wav2vec2, Whisper, DeepSpeech, FastSpeech)
-
Опыт работы с NLP-пайплайнами: препроцессинг текста, нормализация, токенизация, языковые модели.
-
Понимание принципов работы стримингового распознавания речи.
-
Навыки оптимизации моделей, fine tuning.
-
Уверенные знания Python
-
Опыт работы с Docker / Kubernetes, CI/CD, MLOps.
Будет плюсом:
-
Опыт интеграции ASR/TTS в реальные продукты (чат-боты, голосовые ассистенты, мобильные приложения).
-
Навыки развертывания моделей в продакшене (REST/gRPC сервисы, оптимизация latency).
-
Способность работать как с исследовательскими задачами (R&D), так и с продакшн-развертыванием.
Условия:
-
График: 4 часа в день (удалённо), гибко по времени.
-
Оформление: обсуждаемо (самозанятость/ИП/ГПХ).
-
Оплата (0,5 ставки): от 150 000 до 200 000 ₽ «на руки» (Эквивалент 300–400 тыс. ₽ при full‑time).
-
Минимум бюрократии, продукт «с нуля» рядом с техлидом.
Как откликнуться: пришлите коротко (1) чем вы снижали latency в ASR/TTS, (2) пример метрик с последнего проекта (WER/MOS/RTTF), (3) ссылки на код/публикации/демо.