Обязанности:
- Разработка и интеграция LLM-решений: Проектирование, разработка и внедрение (чат-боты, ассистенты, агенты) в существующую экосистему Halykmarket.
- Проектирование и оптимизация RAG-систем: Создание и развитие отказоустойчивых систем генерации с привлечением контекста (RAG), настройка эффективного поиска, индексации данных и работы с векторными базами данных.
- Сбор и подготовка данных (Data Ingestion): Разработка стабильных парсеров, скрейперов и пайплайнов для сбора, очистки и структурирования неструктурированных данных из различных источников для последующего использования в LLM.
- Полный цикл разработки приложений (End-to-End): Самостоятельное написание backend-логики сервисов.
- Оптимизация и оркестрация: Работа с современными LLM-фреймворками (Pydantic AI, Dify, LangChain и др.), тонкая настройка промптов (Prompt Engineering), логики работы агентов и минимизация галлюцинаций моделей.
- Мониторинг и поддержка: Настройка логирования, оценки качества ответов моделей (LLM Evaluation) и оперативное устранение сбоев в работе AI-сервисов.
Требования:
- Глубокие знания Python (включая асинхронное программирование Asyncio, работу с API через FastAPI).
- Опыт коммерческой разработки на Pydantic AI и/или Dify / Langchain (настройка агентов, бизнес-логики, цепочек рассуждений).
- RAG & Vector DB: Понимание архитектуры RAG (Retrieval-Augmented Generation), практический опыт работы с векторными базами данных (Qdrant или аналогами).
- Data Parsing: Опыт написания стабильных парсеров и скрейперов (BeautifulSoup, Scrapy, Playwright/Selenium) с обходом защит и обработкой ошибок.
- Промпт-инжиниринг: Навыки продвинутого Prompt Engineering (Few-shot, Chain-of-Thought, ReAct) и опыт работы с коммерческими/Open-Source моделями (OpenAI API, Anthropic, Llama).
- Инфраструктура и Деплой: Уверенное владение Git, Docker, базовые навыки CI/CD и деплоя приложений на Linux-серверы.Будет большим преимуществом (Nice-to-have):
- Опыт работы с альтернативными фреймворками (LangChain, LlamaIndex, AutoGen).
- Понимание методологий оценки качества ответов LLM (Ragas, TruLens и др.).
- Опыт работы с очередями сообщений (Kafka) и базами данных (PostgreSQL, Redis, Clickhouse, Qdrant, Elasticsearch).
Ключевая зона ответственности:
- Автономный вывод LLM-сервисов в продакшен: Полная ответственность за жизненный цикл AI-компонентов — от прототипирования пайплайна (RAG/агенты) до стабильного готового микросервиса.
- Качество и точность работы RAG-систем: Обеспечение высокой релевантности, полноты и безопасности (отсутствие галлюцинаций) ответов чат-ботов и ассистентов на основе внутренних баз данных.
- Тесная работа с ML инженером.
Условия:
- Стандартный офисный график, без удаленного формата работы;
- Работа по оформлению согласно ТК РК;
- Медицинская страховка;
- График 5/2, отсутствие дресс-кода, плавающее начало рабочего дня;
- Настольный теннис, PS5, теплая атмосфера, крутая команда, помощь и поддержка коллег;
- Комфортный офис в верхней части города.