Halyk Finservice

Python AI инженер (LLM/ML)

Не указана

Алматы
От 3 до 6 лет

Обязанности:

Разработка и интеграция LLM-решений: Проектирование, разработка и внедрение (чат-боты, ассистенты, агенты) в существующую экосистему Halykmarket.
Проектирование и оптимизация RAG-систем: Создание и развитие отказоустойчивых систем генерации с привлечением контекста (RAG), настройка эффективного поиска, индексации данных и работы с векторными базами данных.
Сбор и подготовка данных (Data Ingestion): Разработка стабильных парсеров, скрейперов и пайплайнов для сбора, очистки и структурирования неструктурированных данных из различных источников для последующего использования в LLM.
Полный цикл разработки приложений (End-to-End): Самостоятельное написание backend-логики сервисов.
Оптимизация и оркестрация: Работа с современными LLM-фреймворками (Pydantic AI, Dify, LangChain и др.), тонкая настройка промптов (Prompt Engineering), логики работы агентов и минимизация галлюцинаций моделей.
Мониторинг и поддержка: Настройка логирования, оценки качества ответов моделей (LLM Evaluation) и оперативное устранение сбоев в работе AI-сервисов.

Требования:

Глубокие знания Python (включая асинхронное программирование Asyncio, работу с API через FastAPI).
Опыт коммерческой разработки на Pydantic AI и/или Dify / Langchain (настройка агентов, бизнес-логики, цепочек рассуждений).
RAG & Vector DB: Понимание архитектуры RAG (Retrieval-Augmented Generation), практический опыт работы с векторными базами данных (Qdrant или аналогами).
Data Parsing: Опыт написания стабильных парсеров и скрейперов (BeautifulSoup, Scrapy, Playwright/Selenium) с обходом защит и обработкой ошибок.
Промпт-инжиниринг: Навыки продвинутого Prompt Engineering (Few-shot, Chain-of-Thought, ReAct) и опыт работы с коммерческими/Open-Source моделями (OpenAI API, Anthropic, Llama).
Инфраструктура и Деплой: Уверенное владение Git, Docker, базовые навыки CI/CD и деплоя приложений на Linux-серверы.Будет большим преимуществом (Nice-to-have):
Опыт работы с альтернативными фреймворками (LangChain, LlamaIndex, AutoGen).
Понимание методологий оценки качества ответов LLM (Ragas, TruLens и др.).
Опыт работы с очередями сообщений (Kafka) и базами данных (PostgreSQL, Redis, Clickhouse, Qdrant, Elasticsearch).

Ключевая зона ответственности:

Автономный вывод LLM-сервисов в продакшен: Полная ответственность за жизненный цикл AI-компонентов — от прототипирования пайплайна (RAG/агенты) до стабильного готового микросервиса.
Качество и точность работы RAG-систем: Обеспечение высокой релевантности, полноты и безопасности (отсутствие галлюцинаций) ответов чат-ботов и ассистентов на основе внутренних баз данных.
Тесная работа с ML инженером.

Условия:

Стандартный офисный график, без удаленного формата работы;
Работа по оформлению согласно ТК РК;
Медицинская страховка;
График 5/2, отсутствие дресс-кода, плавающее начало рабочего дня;
Настольный теннис, PS5, теплая атмосфера, крутая команда, помощь и поддержка коллег;
Комфортный офис в верхней части города.

Источник вакансии

Вернуться, к списку вакансий