关于 Agent 和 Agent 的沟通,我想到一个问题。
传统的自然语言交流中,人们说完一句话后会思考其含义,并同时回复,整个过程是交叉互动的。但在目前的 Agent 对话中,更多是使用 JSON-RPC 进行通信。由于 Agent 的模型输出是流式返回,如果讨论非常复杂,涉及到多个段落,那么返回的时间就会很长。通常只有在完整返回后,这些信息和上下文才能共享给另一个 Agent。
但实际上,这些内容并不需要等到完全返回后才有意义,因为每个段落本身就有其独立的含义。在自然语言中,后文的顺序通常不会颠覆前文的意义(尽管对某些特定语法的语言来说并非如此)。
因此,Agent 之间的对话可以采用一种全新的交叉方式:当所有的返回都是流式输出时,从每一个字开始,就实时共享所有的上下文。
显示更多