СБЕР

Middle Speech Engineer (Сбер)

Не указана
  • Москва
  • Полная занятость
  • Удаленная работа
  • От 3 до 6 лет

Наша исследовательская команда занимается разработкой и исследованием новейших решений в области речевых технологий с применением LLM-подходов. Мы работаем над прорывными проектами в сфере генерации речи, кодировщиков аудио и мультимодальных языковых моделей.

Основные направления работы

• Мультимодальные эксперименты с GigaChat, DeepSeek, QWEN

• Fullduplex е2е подход в мультимодальных задачах

• Генерация произвольного голоса, инструктивное управление генерацией с помощью LLM

• Сбор и подготовка сложных датасетов и бенчмарков для аудио задач

Обязанности

  • Разрабатывать и тестировать новые архитектуры моделей
  • Участвовать в сборе и подготовке специализированных датасетов
  • Создавать и улучшать бенчмарки для оценки качества моделей
  • Адаптировать исследовательские наработки для продуктового применения

Требования

  • Глубокие знания в deep learning и обработке естественного языка
  • Практический опыт в области обработки речи или аудио (желательно)
  • Знакомство с современными LLM архитектурами и подходами, а также с мультимодальными архитектурами
  • Хорошее понимание принципов работы речевых моделей

Будет преимуществом

  • Опыт исследовательской работы, а также научные публикации в области ML/NLP/Speech
  • Участие в разработке открытых датасетов и бенчмарков

Условия

  • Достойная заработная плата + бонус
  • Гибкий график, удалёнку
  • Поддержку в публикации научных статей
  • Баланс между исследованиями и практическим применением