USETECH

Data Scientist

Не указана
  • Москва
  • Полная занятость
  • Полный день
  • От 3 до 6 лет

Юзтех – группа аккредитованных ИТ-компаний полного цикла разработки с многолетней экспертизой в передовых технологиях: DWH, BigData, AI/ML, Blockchain, BI, предиктивная аналитика, цифровые двойники производства и рисков.

ГК Юзтех является технологическим партнером таких компаний, как Mail.ru, 2Gis, НЛМК, Еврохим, ГоИнвест, Альфа-Банк, Сбер, ВТБ, МКБ, Самолет, Х5 retail Group, Газпромнефть, Леруа Мерлен, Ситилинк, Ланит, IBS. Также, ГК разрабатывает собственные IT-продукты (Usebus, Octopus, Тил Эйчар) и флагманские проекты, которыми пользуется 70% населения страны.

Сейчас мы в поиске опытного DS на банковский проект.

О проекте: Автоматическая очистка от нерелевантных сообщений - сейчас фильтры выставляются и подбираются вручную, изменяются во времени, нет гарантии актуальности и точности.

LLM as a service(RAG) - для поиска сообщений по экстренным/актуальным новостям нужна возможность управления поисковой строкой по средствам промпт инжиниринга.

Дедубликация новостей, отбор сообщений, связанных с конкретным продуктом, суммаризация, далее увязывать со справочником корневых причин. Определение основных болей клиентов (частота / критичность) в разрезе продуктов, определение направлений развития продуктов/определение зон потенциального развития продуктов.

Распознавание пакета документов, поступающих от клиента в рамках процесса работы со сделкой или в рамках процедуры мониторинга. Автоматическое определение типа документа, NER и структурирование данных, полученных из текста документа.

Итак, вам предстоит:

Моделирование при помощи классических алгоритмов, моделирование в области задач NLP, работа с данными, разработка в области AI:

• Решение задач, направленных на обработку и структурирование текстовой информации для разработки моделей.

• Построение решений на базе LLM моделей \ разработка промптов.

• Суммаризация информации для генерации кредитных меморандумов \ аналитических записок по клиенту: новости, источники – агрегаторы, кредитная история, транзакции, фин. отчетность, арбитражи и пр.

• Генерация выводов по кредитоспособности клиента с помощью LLM

• Определение тональности информации по клиенту и выделение негатива по клиенту с помощью LLM

• Генерация рекомендаций по структуре сделки с клиентом с помощью LLM

• Построение RAG сервиса базы знаний по финансовому анализу и работе с залогами

• Формулирование гипотез для улучшения алгоритмов и сервисов, реализация дизайна экспериментов, проведение экспериментов с анализом итоговых результатов.

Мы будем рады рассмотреть вашу кандидатуру, если у вас есть:

• Высшее образование

• Понимание классических алгоритмов классификации и регрессии ML (деревья\бустинг, линейная регрессия, наивный байес)

• Понимание классических метрик accuracy\recision\recall\f1

• Знание базовых алгоритмов кластеризации и метрик

• Знания в построении векторных представлений слови и обучении embedding моделей

• Знания базовых архитектур нейронных сетей для работы с текстом (RNN, LSTM, BERT) 6) опыт работы с LLM (файнтюнинг LLM)

• Опыт построения RAG и работы с фреймворками langchain приветствуется

• Уверенное программирование на языке python\numpy\pandas

• Хорошее знание NLP алгоритмов:

1. Хорошо знать базу классического DS (модели, метрики)

2. Опыт работы и глубокое понимание seq2seq, word2vec, fasttext, tf-idf

3. Знание теории в области применения RNN, LSTM, transformers. Знание плюсов и минусов, областей применения. Опыт их применения в рабочих задачах

4. Опыт работы с текстовыми метриками, знать и уметь применять: BLEU, NIST, ROUGE, METEOR

5. Опыт файнтюнинга и алаймента

6. Понимать разницу между токенизацией, лемматизацией и стеммингом

Мы предлагаем:

  • Карьерную и профессиональную возможность в стабильной, аккредитованной ИТ-компании.

  • Расширенный полис ДМС со стоматологией, корпоративный психолог.

  • Удаленную работу и гибкий график.

  • Необходимую технику для комфортной работы.

  • Обучение, сертификацию, Usetech English Club – онлайн изучение английского.

  • Доступ к Корпоративной библиотеке и к Корпоративному университету

  • Внутрикорпоративные профильные коммьюнити.

  • Заботу о детях сотрудников: корпоративные скидки, подарки, детские дни.

  • Геймифицированную программу лояльности: поверь, ты будешь восторге от нашего корпоративного магазина!

  • Корпоративная жизнь: мы много работаем и классно отдыхаем.