用于 AI 代理的章鱼架构
论文 章鱼架构描述了一个系统,它有一个中央协调大脑,将任务分派给半自主的子大脑。2026年6月15日 TorkBot 的设计有点像章鱼。这种架构源于一系列的死胡同和迭代改进。当我说章鱼时,我的意思是 TorkBot 有一个集中式的“脑”,它指挥着许多半自主的附肢,每个附肢都有自己的大脑,并向中央调度员汇报。静态通道是长期存在的附肢。Curator 就是其中之一。插件可以贡献其他附肢,例如 Google Workspace 通道。通道模板是不同的。模板是一个可以为特定目的实例化的能力。沙盒快照是不同的:它根本不是一个合作者,只是一个为未来沙盒支持通道保存的文件系统起点。交互与能力 数个相互竞争的压力催促我进入这种架构。对表面交互的响应能力——该代理需要设计,使其转弯的复杂性基本上是有界的,并且可以完全避免 I/O。这使得代理能够快速互动,即使任务或工作可能需要相当长的时间。能力——为了保持转弯高效,代理不应该局限于它能完成的事情。它需要通过委派追求复杂任务的机制,并能够近乎实时地观察和引导这些任务。连续性——代理应该保持一个连续的视角和个性。最佳的连续性来自于一个持续编排的单一 LLM 对话。通过这种方式,个性和短期记忆不需要“添加”;相反,它们是架构的副产品。这些压力促使我设计了多个“通道”,如上图所示。“前台”通道是用户通过表面活动互动的 LLM 对话。但在这里,我做了一个可能有争议的赌注:所有表面上的活动都经过同一个前台对话。线程、频道,甚至平台都被合并。目前,这种认知复杂性或许超出了大多数模型的能力,甚至可能超出了前沿。但我相信,这种情况不会持续太久。所有表面上的活动都经过同一个前台对话。关于 TorkBot 的我的一个论点是押注于涌现行为和涌现智能。想出跨平台定义的任意边界拆分 LLM 对话的系统与连续性目标是背道而驰的。我希望我的代理在线程之间乃至表面之间建立联系。我希望代理能够轻松继续在 Slack 开始的工作,在 GitHub 上继续。如果我们在模型智能上还没有达到这一点,我敢打赌我们很快就会到达,而为那个世界设计的代理系统将在直观性和能力上超越竞争对手。章鱼是如何工作的 章鱼的概念在这里发挥实际作用。它是绑定问题的形状。这并不是为了追逐名声而跳上子代理的潮流。这个设计是自然而然地出现并赢得了存在。毕竟,这还是回归到上下文管理。每个附肢都有其自己的上下文。前台通过“交谈”将工作交给其他通道。通道之间的通信只是文本,寄希望于预训练和后训练严重偏向散文作为意图的载体。前台选择一个通道模板——如果是沙盒通道,则选择一个 VM 快照——并向该通道发送初始消息,说明它想要什么。对于已经生成的通道,发送一条简单的消息。通道可以自己处理工具调用、遇到死胡同、进行 I/O 和任何数量更复杂的沙盒支持工作流的麻烦。这种混乱保持在通道的上下文中。通道之间通过两种机制进行通信:如上所述的聊天;以及通过通道的 ./shared 目录引用虚拟文件系统工件。前台对话可以在各个表面之间保持连续,这就是我希望实现个性和跨线程直觉的目标,而不会成为每个中间工件死去的地方。附肢可以为任务携带本地工作记忆。前台可以携带关系、当前意图和综合信息。这也使得压缩变得相当明显。每个通道在一定阈值上持续异步压缩,如果由于某种奇怪的事件,它超过另一个更高的阈值,则同步压缩。由此设计带来的好处 平均交互时间是目标。完成可能需要一段时间。通道可以阅读文档、等待 I/O、运行测试、遇到障碍并重新尝试,这是可以的。因为一个附肢忙于工作,前台不可以变得黑暗。因此,前台通道必须保持小而无趣:稳定的提示、当前意图、最近的表面活动、紧凑的摘要和引用证据。
本站免费、广告极少。如果觉得有帮助,可以请我们喝杯咖啡 —— 任何金额都对持续运营有实际帮助。
☕请我喝杯咖啡