Мы строим Business Operating System — платформу, где AI-агенты помогают предпринимателям создавать бизнесы и управлять ими.
В нашу команду ищем harness-инженера, который будет повышать результативность агентов: через контекст, тулзы, скиллы, регрессионные тесты, evals и экспериментальные пайплайны.
Мы уверены, что средняя модель может решать задачи на уровне тяжёлой, если вокруг неё правильно собран harness.
Что делать:
• тестировать модели, настройки и агентные сценарии;
• собирать промпты, контекстные паки, скиллы и проверки;
• разбирать ошибки агентов;
• строить регрессионные тесты;
• переносить рабочие паттерны в продакшн BOS.PRO.
Тебе подходит, если ты:
• Понимаешь, что «если не Tuning, то Harnessing»
• Энтузиаст агентов: пишешь >12 ч. / день >10к. LOC / день (сокращая техдолг)
• Понимаешь, что стек не важен, но на ты с TypeScript / React / Postgre SQL
• Окончил технический вуз; вероятно, финалист олимпиад
• Любишь работать исследовательски: гипотеза → тест → данные → вывод.
Отбор: harness-хакатон → практическая задача → оффер.
• На хакатоне покажи рабочий кейс: как ты повышаешь результативность AI-агентов и проверяешь, что изменения действительно улучшают результат.
• Можно также показать свой кейс внедрения или разобрать один из подходов: Harness / Meta / AgentSpec / AutoHarness / NLAC / AutoResearch / GStack.
Откликайся, если хочешь не просто пользоваться AI-агентами, а делать их сильнее.