Университет ИТМО

NLP инженер– AI-агент для обзора научной литературы

Не указана

Санкт-Петербург
Полная занятость
Полный день
От 1 года до 3 лет

ArXiv
ИИ
NLP
семантический поиск
Python
NLP-библиотеки
методы машинного обучения
Английский — B1 — Средний

Мы ищем высококвалифицированного специалиста по семантическому поиску для работы в нашей команде разработки AI. Ваша основная задача – разработка и оптимизация интеллектуального агента, способного выполнять комплексные обзоры научных публикаций на платформе ArXiv. Агент будет использовать передовые методы семантического поиска, обработки естественного языка (NLP) и машинного обучения для извлечения, суммирования и синтеза релевантной информации в области материаловедения.

Обязанности:

проектирование и реализация алгоритмов семантического поиска, адаптированных для поиска научных публикаций на ArXiv;
разработка NLP-pipelines для парсинга, понимания и извлечения ключевых понятий, методов, результатов и выводов из научных статей;
создание и обучение моделей для классификации документов, распознавания сущностей, извлечения связей и суммирования, специфичных для материаловедения;
интеграция семантического поискового агента в архитектуру мультиагентной системы для совместного сбора информации и рассуждений;
тесное взаимодействие с экспертами в области материаловедения для обеспечения релевантности и точности извлекаемой информации;
оптимизация релевантности поиска, точности, полноты и масштабируемости системы для обработки больших объёмов научных документов;
отслеживание современных методов в области семантического поиска, NLP и AI для научного анализа текстов.

Требования:

степень магистра или кандидата наук в области компьютерных наук, искусственного интеллекта, Data Science или смежных дисциплин;
подтверждённый опыт работы с семантическим поиском, информационным поиском и NLP, предпочтительно применительно к научным или техническим документам;
уверенные навыки программирования на Python и опыт работы с NLP-библиотеками/фреймворками (spaCy, Hugging Face Transformers, AllenNLP или аналогичные);
опыт работы с крупными научными наборами данных и API (например, ArXiv API);
знание методов машинного обучения для классификации текстов, распознавания сущностей, суммирования и построения графов знаний;
понимание терминологии и концепций материаловедения будет большим плюсом.

Желательные навыки:

опыт разработки мультиагентных систем или AI-агентов;
знания в области векторных поисковых движков (FAISS, Pinecone) и техник встраивания для семантического поиска;
наличие публикаций или вкладов в open-source проекты по семантическому поиску или анализу научных текстов.

Мы предлагаем:

уникальную возможность работать над передовым AI-проектом, влияющим на развитие материаловедения во всём мире;
конкурентоспособную заработную плату и социальный пакет;
гибкий график работы и возможность удалённой работы;
коллаборативную и интеллектуально стимулирующую среду с экспертами в AI и материаловедении;
возможности профессионального развития: конференции, семинары и обучение.

Источник вакансии

Вернуться, к списку вакансий