Microsoft представила AgentRx: систему автоматической диагностики ИИ-агентов
Новый диагностический фреймворк AgentRx помогает локализовать и исправлять ошибки в сложных многошаговых агентных системах, делая их более предсказуемыми и надежными для корпоративного использования.

Microsoft анонсировала AgentRx — автоматизированный диагностический фреймворк, предназначенный для поиска и исправления ошибок в работе искусственного интеллекта. По мере того как ИИ эволюционирует от простых диалоговых ботов к сложным автономным системам, способным самостоятельно планировать и выполнять многошаговые задачи, цена ошибки многократно возрастает. AgentRx создан для того, чтобы сделать такие системы более прозрачными и устойчивыми к сбоям.
Долгое время взаимодействие с большими языковыми моделями (LLM) происходило в формате прямого диалога. Если модель выдавала некорректный ответ, разработчик или пользователь видел это сразу. Однако современные автономные агенты работают иначе. Они могут выполнять десятки последовательных действий: анализировать данные, обращаться к внешним интерфейсам (API), писать и тестировать программный код. В такой цепочке небольшая неточность на первом этапе может привести к критическому сбою на десятом. Традиционные методы отладки программного обеспечения, основанные на поиске ошибок в строгом, детерминированном коде, плохо подходят для вероятностной природы нейросетей.

Flowchart illustrating an agent failure attribution pipeline. In the upper left, a blue rounded box labeled “Task Context” contains three stacked inputs: “Domain Policy,” “Tool Schema,” and “Trajectory.” A downward arrow leads into a large yellow rounded rectangle representing the validation pipeline. Inside this area, a green box labeled “Constraint Generator” feeds into a blue box labeled “Constraint Checker.” To their right is a JSON-like constraint specification with fields such as assertion_name:









