Левченко Екатерина Валериевна

Data Engineer (Junior)

До 2 000 USD
  • Москва
  • Полная занятость
  • Удаленная работа
  • От 1 года до 3 лет
  • Python
  • Machine Learning
  • Data Engineer
  • AI
  • Data Science

О компании:
Glam AI — это быстрорастущий AI-стартап, мобильное приложение, которое позволяет загружать фото и видео, чтобы мгновенно примерить виртуальные образы и создавать трендовый контент, который становится виральным.

  • $3M ARR и более 150, 000 лояльных пользователей в США и Европе;
  • инвесторы с опытом создания ИИ приложений и вывода их на рынок (включая Looksery и AI Factory, которые в дальнейшем приобрела компания Snap);
  • топовая команда топовой командой (экс-Lensa, Picsart, Viber, AIRI, Яндекс).

Эта вакансия вам идеально подойдёт если вас вдохновляет работа масштабными датасетами и выстраивание инфраструктуры на стыке ML-исследований и продуктовой разработки.

Готовы брать даже без опыта - главное, классно сделать тестовое, это отличная возможность стартовать свою карьеру!

Что необходимо делать:

  • Создавать и масштабировать пайплайны для сбора, фильтрации и подготовки визуальных датасетов (изображения, видео, 3D, подписи, метаданные) из открытых и лицензированных источников

  • Автоматизировать аннотацию, дедупликацию и аугментацию данных для обучения ML-моделей

  • Работать в тесной связке с ML-инженерами и ресёрчерами — адаптировать данные под задачи генеративных моделей (видео, изображение)

  • Развивать инструменты и процессы контроля качества, версионирования, мониторинга и соблюдения лицензий

  • Проектировать инфраструктуру для хранения и доступа к петабайтным объёмам данных в облаке (AWS/GCP)

  • Обеспечивать качество и разнообразие данных для обучения моделей нового поколения (Stable Diffusion, Vision Transformers и др.)

Будет супер если в профиле есть:

  • опыт т 1 года опыта в роли data engineer / backend-инженера / ML infra-инженера (не критично, готовы рассматривать в т.ч. студентов без опыта)
  • опыт работы с большими неструктурированными данными, особенно визуальными
  • опыт работы с web scraping, API, media crawling
  • опыт работы/понимание как работать с облаками (AWS / GCP), хранилищами (S3, BigQuery и др.)
  • понимание метрик качества данных и валидации

Мастхев: отличное знание Python

Также, будет плюсом опыт с датасетами по типу LAION, COYO, OpenImages, а также с аннотацией и мультимедийной обработкой.

Условия:

  • Конкурентная зарплата + бонусы

  • Всё необходимое оборудование + Cloud Credits и GPU

  • Полная удалёнка из любой точки мира, гибкий график

  • Участие в разработке инновационных AI-продуктов в команде экспертов

Процесс отбора:

1. Тестовое задание

2. Техническое собеседование

3. Финальный созвон → презентация оффера

Если интересно - откликайся!

Присоединяйтесь к Glam AI и создавайте датасеты, которые станут основой самых креативных моделей ИИ будущего.