Циан — публичная IT-компания, крупнейший в России сервис для поиска недвижимости, входит в мировой топ-10.
Больше 20 лет мы помогаем быстрее решать вопросы с жилой и коммерческой недвижимостью: найти, оценить, купить, снять, продать, сдать и оформить сделку без рисков. Мы делаем сервисы, которые помогают владельцам недвижимости, застройщикам, агентам и обычным людям оптимизировать рутину поиска и продаж.
cian.ru — это большой и сложный продукт, в котором представлено несколько типов недвижимости и типов сделки, а также есть множество сервисов, информационных материалов и собственное медиа.
Ежемесячная аудитория около 18,7 млн. человек. Растить число пользователей и решать их проблемы помогают уже больше 1000 человек.
О команде:
В Циан большая команда ML - DS, DE, своя MLOps-платформа.
Команда разделена на продуктовые стримы. Мы формируем самодостаточные команды (разработчики, аналитики, ML-инженеры) для решения задач бизнес-направления. С процессами интеграции моделей в продакшн нам помогает команда MLOps-платформы. В команде настроены процессы перфоманс ревью, регулярного обмена опытом, выделяем время на исследовательскую работу.
Мы ищем Middle Data Scientist в команду Модерации. Команда отвечает за качество контента на площадке и делает так, чтобы пользователи видели только актуальные и настоящие объявления. Для эффективной борьбы с множеством нарушений коллеги разрабатывают инструменты, которые обрабатывают миллионы изображений, звонков, чатов и кликов пользователей.
Стек:
-
Пишем преимущественно на Python (Numpy, SciPy, Pandas, sklearn, PyTorch).
-
Активно используем экосистему Hadoop (PySpark, Hive, Kafka), у нас свой большой кластер
-
Для автоматизации запусков наших пайплайнов используем Airflow
-
Для технических метрик — Grafana, для бизнес-метрик — Superset/FineBI.
Основные задачи, которые нужно будет решать:
- Разработка моделей машинного обучения, направленных на борьбу с нарушениями правил площадки и недобросовесными пользователями (формализация и постановки задачи, сбор данных, обучение, онлайн/оффлайн оценка качества, мониторинг)
- Внедрение своих ML-моделей в продакшн: написание микросервисов и Airflow DAG’ов
- Коммуникация с продуктом и разработкой
Примеры задач в обозримом будущем:
- Развитие моделей обнаружения подозрительных объявлений в Посутке по ходу жизненного цикла объявления
- Построение моделей оценки качества коммуникаций риелторов в чатах и во время звонков
- Автомодерация отзывов на объявления и агентов
Требования к кандидату:
- Опыт: Не менее 2х лет релевантного опыта на позиции DS в продуктовой компании. Опыт доведения ML-моделей до продакшена и оценки влияния на бизнес от внедрения
- Python: навык писать легко читаемый и поддерживаемый код, опыт выкатки сервисов в продакшн
- Классический ML: бустинги, ApproxNN
- Deep learning: опыт обучения CV/NLP моделек на PyTorch (хотя бы в рамках учебных курсов)
- SQL: оконные функции, оптимизация запросов
- Желателен опыт с Apache стеком: HDFS/Kafka/Spark/Airflow
Что мы предлагаем:
-
Удаленную работу с возможностью приходить в офис в Москве, Санкт-Петербурге и Новосибирске. В офисе – кухни, оборудованные всем необходимым, а также снеки, фрукты, кофе и чай, бесплатная авто и вело парковки;
-
Технический рост. У нас есть успешные примеры роста с точки зрения ML, а также инженерии (разработка, архитектура приложений и сервисов) : есть возможность консультироваться с командой и брать инициативу по реализации крупных и сложных проектов.
-
Рост и развитие: в первые месяцы у каждого сотрудника есть ментор, после появляется личный план развития и возможность прокачивать soft/ hard skills на практике, обучении, конференциях;
-
ДМС с первого рабочего дня (со стоматологией, госпитализацией, страховкой выезжающего за пределы нашей страны);
-
5 day off в год, помимо основного отпуска;
-
Кафетерий льгот Benefactory;