О команде:
Каждый день наши автономные машины собирают много данных, которые мы собираем и анализируем для улучшения и тестирования нашего ПО. Одно из направлений разработки – распознавание, которое очень тесно связано с нейронными сетями, а они – с данными.
Мы ищем человека который готов погружаться в процессы работы с данными в команде DeepLearning инженеров, хочет организовывать процессы работы с данными на стыке технологий, искать способы оптимизации пайплайнов работы с данными, придумывать новые методы и предлагать решения сложных проблем.
Чем предстоит заниматься:
- Разработка пайплайнов сборка, обработки, доставки данных;
- Обработка и форматирование данных для обучения нейросетевых моделей;
- Написание инструментов для работы с данными.
Что мы ждем от кандидата:
- Разработка на языке Python;
- Хорошее знание SQL (на уровне джойнов);
- Опыт работы со Spark;
- Опыт обработки данных с использованием Python (Pandas/Polars).
Будет плюсом:
- Опыт работы с Clickhouse;
- Опыт работы с данными для CV;
- Опыт работы с Dagster.