Университет ИТМО

NLP инженер– AI-агент для обзора научной литературы

Не указана
  • Санкт-Петербург
  • Полная занятость
  • Полный день
  • От 1 года до 3 лет
  • ArXiv
  • ИИ
  • NLP
  • семантический поиск
  • Python
  • NLP-библиотеки
  • методы машинного обучения
  • Английский — B1 — Средний

Мы ищем высококвалифицированного специалиста по семантическому поиску для работы в нашей команде разработки AI. Ваша основная задача – разработка и оптимизация интеллектуального агента, способного выполнять комплексные обзоры научных публикаций на платформе ArXiv. Агент будет использовать передовые методы семантического поиска, обработки естественного языка (NLP) и машинного обучения для извлечения, суммирования и синтеза релевантной информации в области материаловедения.

Обязанности:

  • проектирование и реализация алгоритмов семантического поиска, адаптированных для поиска научных публикаций на ArXiv;
  • разработка NLP-pipelines для парсинга, понимания и извлечения ключевых понятий, методов, результатов и выводов из научных статей;
  • создание и обучение моделей для классификации документов, распознавания сущностей, извлечения связей и суммирования, специфичных для материаловедения;
  • интеграция семантического поискового агента в архитектуру мультиагентной системы для совместного сбора информации и рассуждений;
  • тесное взаимодействие с экспертами в области материаловедения для обеспечения релевантности и точности извлекаемой информации;
  • оптимизация релевантности поиска, точности, полноты и масштабируемости системы для обработки больших объёмов научных документов;
  • отслеживание современных методов в области семантического поиска, NLP и AI для научного анализа текстов.

Требования:

  • степень магистра или кандидата наук в области компьютерных наук, искусственного интеллекта, Data Science или смежных дисциплин;
  • подтверждённый опыт работы с семантическим поиском, информационным поиском и NLP, предпочтительно применительно к научным или техническим документам;
  • уверенные навыки программирования на Python и опыт работы с NLP-библиотеками/фреймворками (spaCy, Hugging Face Transformers, AllenNLP или аналогичные);
  • опыт работы с крупными научными наборами данных и API (например, ArXiv API);
  • знание методов машинного обучения для классификации текстов, распознавания сущностей, суммирования и построения графов знаний;
  • понимание терминологии и концепций материаловедения будет большим плюсом.

Желательные навыки:

  • опыт разработки мультиагентных систем или AI-агентов;
  • знания в области векторных поисковых движков (FAISS, Pinecone) и техник встраивания для семантического поиска;
  • наличие публикаций или вкладов в open-source проекты по семантическому поиску или анализу научных текстов.

Мы предлагаем:

  • уникальную возможность работать над передовым AI-проектом, влияющим на развитие материаловедения во всём мире;
  • конкурентоспособную заработную плату и социальный пакет;
  • гибкий график работы и возможность удалённой работы;
  • коллаборативную и интеллектуально стимулирующую среду с экспертами в AI и материаловедении;
  • возможности профессионального развития: конференции, семинары и обучение.