USETECH

Data Scientist

Не указана
  • Москва
  • Полная занятость
  • Удаленная работа
  • От 3 до 6 лет
  • ML
  • accuracy\recision\recall\f1
  • seq2seq, word2vec, fasttext, tf-idf
  • RNN, LSTM, transformers
  • BLEU, NIST, ROUGE, METEOR
  • NLP
  • OCR
  • LLM

Юзтех – группа аккредитованных ИТ-компаний полного цикла разработки с многолетней экспертизой в передовых технологиях: DWH, BigData, AI/ML, Blockchain, BI, предиктивная аналитика, цифровые двойники производства и рисков.
ГК Юзтех является технологическим партнером таких компаний, как Mail.ru, 2Gis, НЛМК, Еврохим, ГоИнвест, Альфа-Банк, Сбер, ВТБ, МКБ, Самолет, Х5 retail Group, Газпромнефть, Леруа Мерлен, Ситилинк, Ланит, IBS. Также, ГК разрабатывает собственные IT-продукты (Usebus, Octopus, Тил Эйчар) и флагманские проекты, которыми пользуется 70% населения страны.

Приглашаем присоединиться к команде нашего заказчика, которая занимается банковским проектом: Автоматическая очистка от нерелевантных сообщений - сейчас фильтры выставляются и подбираются вручную, изменяются во времени, нет гарантии актуальности и точности.
LLM as a service(RAG) - для поиска сообщений по экстренным/актуальным новостям нужна возможность управления поисковой строкой по средствам промпт инжиниринга.
Дедубликация новостей, отбор сообщений, связанных с конкретным продуктом, суммаризация, далее увязывать со справочником корневых причин. Определение основных болей клиентов (частота / критичность) в разрезе продуктов, определение направлений развития продуктов/определение зон потенциального развития продуктов.
Распознавание пакета документов, поступающих от клиента в рамках процесса работы со сделкой или в рамках процедуры мониторинга. Автоматическое определение типа документа, NER и структурирование данных, полученных из текста документа.

Задачи:

  • Моделирование при помощи классических алгоритмов, моделирование в области задач NLP, работа с данными, разработка в области AI.

  • Решение задач, направленных на обработку и структурирование текстовой информации для разработки моделей.

  • Построение решений на базе LLM моделей \ разработка промптов.

  • Суммаризация информации для генерации кредитных меморандумов \ аналитических записок по клиенту: новости, источники – агрегаторы, кредитная история, транзакции, фин. отчетность, арбитражи и пр.

  • Генерация выводов по кредитоспособности клиента с помощью LLM.

  • Определение тональности информации по клиенту \ выделение негатива по клиенту с помощью LLM.

  • Генерация рекомендаций по структуре сделки с клиентом с помощью LLM.

  • Построение RAG сервиса базы знаний по финансовому анализу и работе с залогами.

  • Формулирование гипотез для улучшения алгоритмов и сервисов, реализация дизайна экспериментов, проведение экспериментов с анализом итоговых результатов.

Ваш опыт:

  • Высшее образование

  • Понимание классических алгоритмов классификации и регрессии ML (деревья\бустинг, линейная регрессия, наивный байес)

  • Понимание классических метрик accuracy\recision\recall\f1

  • Знание базовых алгоритмов кластеризации и метрик

  • Хорошее знание базы классического DS (модели, метрики)

  • Опыт работы и глубокое понимание seq2seq, word2vec, fasttext, tf-idf

  • Знание теории в области применения RNN, LSTM, transformers. Знание плюсов и минусов, областей применения. Опыт их применения в рабочих задачах

  • Опыт работы с текстовыми метриками, знать и уметь применять: BLEU, NIST, ROUGE, METEOR

  • Опыт файнтюнинга и алаймента

  • Понимать разницу между токенизацией, лемматизацией и стеммингом

  • Опыт работы в проектах с анализом документов, переводом текста, обработкой

  • Опыт с NLP, опыт CV (OCR)

  • Знания в построении векторных представлений слови и обучении embedding моделей.
  • Знания базовых архитектур нейронных сетей для работы с текстом (RNN, LSTM, BERT) 6) опыт работы с LLM (файнтюнинг LLM).
  • Опыт построения RAG и работы с фреймворками langchain приветствуется.
  • Уверенное программирование на языке python\numpy\pandas

Мы предлагаем:

  • Карьерную и профессиональную возможность в стабильной, аккредитованной ИТ-компании;
  • Расширенный полис ДМС со стоматологией, корпоративный психолог;
  • Удаленную работу и гибкий график;
  • Необходимую технику для комфортной работы;
  • Обучение, сертификацию, Usetech English Club – онлайн изучение английского;
  • Доступ к Корпоративной библиотеке и к Корпоративному университету;
  • Внутрикорпоративные профильные коммьюнити;
  • Заботу о детях сотрудников: корпоративные скидки, подарки, детские дни;
  • Геймифицированную программу лояльности: поверь, ты будешь восторге от нашего корпоративного магазина!
  • Интересную корпоративную жизнь: мы много работаем и классно отдыхаем.