工具过载正在削弱智能体性能
“工具过载”正成为智能体性能发展的关键瓶颈。这一判断基于 VS Code 中 Copilot Chat 的大规模测试与多项基准实验,结论呈现出与长期“工具越多越好”的直觉相反的结果。
工具越多,模型的决策空间越大,每次调用都需在庞大集合中反复试探,造成推理负担加重。工具描述与状态占用上下文与缓存,使关键语义信息被稀释,增加无效推理成本。在复杂工具集下,模型更容易采取不必要的工具调用。
Github的解决方式是利用内部嵌入模型按语义相似度将工具聚为虚拟类别,避免一次性暴露所有工具,通过嵌入匹配预选最相关工具,使模型无需盲目探索。
“工具过载”正成为智能体性能发展的关键瓶颈。这一判断基于 VS Code 中 Copilot Chat 的大规模测试与多项基准实验,结论呈现出与长期“工具越多越好”的直觉相反的结果。
工具越多,模型的决策空间越大,每次调用都需在庞大集合中反复试探,造成推理负担加重。工具描述与状态占用上下文与缓存,使关键语义信息被稀释,增加无效推理成本。在复杂工具集下,模型更容易采取不必要的工具调用。
Github的解决方式是利用内部嵌入模型按语义相似度将工具聚为虚拟类别,避免一次性暴露所有工具,通过嵌入匹配预选最相关工具,使模型无需盲目探索。