跳转到内容

Agent 可观测性栈设计

  • 工具调用耗时和失败率
  • 每轮上下文 token 消耗
  • 关键决策节点的结构化事件
  1. Trace Timeline:按轮次还原行为。
  2. Tool Audit:按工具聚合异常。
  3. Replay Pack:可复现实验输入输出。

可把稳定高频行为沉淀成共享 instinct,再通过 evolve 生成更高阶流程资产。