Кто мы?
Мы создаем инновационные решения в сфере СМИ с использованием машинного обучения для автоматизации процессов обработки информации.
Наша цель — трансформировать работу информационно-аналитических агентств и средств массовой информации через:
- автоматизацию процесса разметки текстовых документов;
- интеллектуальную генерацию производной информации на основе текстовых документов;
- разработку специализированных метрик измерения информационных свойств текстовых документов;
- создание моделей машинного обучения на основе разработанных метрик;
- масштабирование метрик и моделей на другие информационные сферы и языки.
Чем предстоит заниматься?
Сбор данных, исследования и эксперименты с метриками и моделями:
- поиск, создание и генерация данных, необходимых для проведения исследований;
- разметка большого числа текстовых материалов, в том числе на разных языках, под разные ML-задачи;
- создание гипотез по решению задач на предоставляемых данных;
- разработка и настройка prompts для различных задач;
- автоматизация процессов разметки данных и создания специализированных наборов данных;
- применение различных моделей машинного обучения и сопутствующих библиотек;
- подготовка документации и инструкций по использованию результатов исследований и разработок;
- тестирование и анализ результатов работы подготовленных метрик и моделей.
Для этого необходимо уметь?
- уверенная работа с python: pandas, numpy, sklearn, PyTorch, matplotib и аналогов.
- базовые знания SQL и NoSQL баз данных;
- умение создавать запросы к базам данных и модифицировать их;
- уверенное владения инструментами обработки текстовых и табличных данных (Word, Excel и т.д.).
- умение предоставлять и представлять данные публично, объяснять сложное простыми словам (презентации PowerPoint).
Будет преимуществом:
- аналитический склад ума и способность искать последовательности, схожие и отличительные признаки, структурировать данные;
- умение формулировать промежуточные выводы, критически относиться к результатам своей деятельности;
- интерес к актуальным исследованиям по вопросам машинного обучения;
- усидчивость, аккуратность и целеустремленность безотносительно от объема данных, которые необходимо проанализировать.
- языковая грамотность;
- знание английского не ниже B1;
- уверенное знание иностранного языка (помимо английского) будет плюсом.