СБЕР

Middle Speech Engineer (Сбер)

Не указана

Москва
Полная занятость
Удаленная работа
От 3 до 6 лет

Наша исследовательская команда занимается разработкой и исследованием новейших решений в области речевых технологий с применением LLM-подходов. Мы работаем над прорывными проектами в сфере генерации речи, кодировщиков аудио и мультимодальных языковых моделей.

Основные направления работы

• Мультимодальные эксперименты с GigaChat, DeepSeek, QWEN

• Fullduplex е2е подход в мультимодальных задачах

• Генерация произвольного голоса, инструктивное управление генерацией с помощью LLM

• Сбор и подготовка сложных датасетов и бенчмарков для аудио задач

Обязанности

Разрабатывать и тестировать новые архитектуры моделей
Участвовать в сборе и подготовке специализированных датасетов
Создавать и улучшать бенчмарки для оценки качества моделей
Адаптировать исследовательские наработки для продуктового применения

Требования

Глубокие знания в deep learning и обработке естественного языка
Практический опыт в области обработки речи или аудио (желательно)
Знакомство с современными LLM архитектурами и подходами, а также с мультимодальными архитектурами
Хорошее понимание принципов работы речевых моделей

Будет преимуществом

Опыт исследовательской работы, а также научные публикации в области ML/NLP/Speech
Участие в разработке открытых датасетов и бенчмарков

Условия

Достойная заработная плата + бонус
Гибкий график, удалёнку
Поддержку в публикации научных статей
Баланс между исследованиями и практическим применением

Источник вакансии

Вернуться, к списку вакансий