用于 AI 代理的章鱼架构

论文章鱼架构描述了一个系统，它有一个中央协调大脑，将任务分派给半自主的子大脑。2026年6月15日 TorkBot 的设计有点像章鱼。这种架构源于一系列的死胡同和迭代改进。当我说章鱼时，我的意思是 TorkBot 有一个集中式的“脑”，它指挥着许多半自主的附肢，每个附肢都有自己的大脑，并向中央调度员汇报。静态通道是长期存在的附肢。Curator 就是其中之一。插件可以贡献其他附肢，例如 Google Workspace 通道。通道模板是不同的。模板是一个可以为特定目的实例化的能力。沙盒快照是不同的：它根本不是一个合作者，只是一个为未来沙盒支持通道保存的文件系统起点。交互与能力数个相互竞争的压力催促我进入这种架构。对表面交互的响应能力——该代理需要设计，使其转弯的复杂性基本上是有界的，并且可以完全避免 I/O。这使得代理能够快速互动，即使任务或工作可能需要相当长的时间。能力——为了保持转弯高效，代理不应该局限于它能完成的事情。它需要通过委派追求复杂任务的机制，并能够近乎实时地观察和引导这些任务。连续性——代理应该保持一个连续的视角和个性。最佳的连续性来自于一个持续编排的单一 LLM 对话。通过这种方式，个性和短期记忆不需要“添加”；相反，它们是架构的副产品。这些压力促使我设计了多个“通道”，如上图所示。“前台”通道是用户通过表面活动互动的 LLM 对话。但在这里，我做了一个可能有争议的赌注：所有表面上的活动都经过同一个前台对话。线程、频道，甚至平台都被合并。目前，这种认知复杂性或许超出了大多数模型的能力，甚至可能超出了前沿。但我相信，这种情况不会持续太久。所有表面上的活动都经过同一个前台对话。关于 TorkBot 的我的一个论点是押注于涌现行为和涌现智能。想出跨平台定义的任意边界拆分 LLM 对话的系统与连续性目标是背道而驰的。我希望我的代理在线程之间乃至表面之间建立联系。我希望代理能够轻松继续在 Slack 开始的工作，在 GitHub 上继续。如果我们在模型智能上还没有达到这一点，我敢打赌我们很快就会到达，而为那个世界设计的代理系统将在直观性和能力上超越竞争对手。章鱼是如何工作的章鱼的概念在这里发挥实际作用。它是绑定问题的形状。这并不是为了追逐名声而跳上子代理的潮流。这个设计是自然而然地出现并赢得了存在。毕竟，这还是回归到上下文管理。每个附肢都有其自己的上下文。前台通过“交谈”将工作交给其他通道。通道之间的通信只是文本，寄希望于预训练和后训练严重偏向散文作为意图的载体。前台选择一个通道模板——如果是沙盒通道，则选择一个 VM 快照——并向该通道发送初始消息，说明它想要什么。对于已经生成的通道，发送一条简单的消息。通道可以自己处理工具调用、遇到死胡同、进行 I/O 和任何数量更复杂的沙盒支持工作流的麻烦。这种混乱保持在通道的上下文中。通道之间通过两种机制进行通信：如上所述的聊天；以及通过通道的 ./shared 目录引用虚拟文件系统工件。前台对话可以在各个表面之间保持连续，这就是我希望实现个性和跨线程直觉的目标，而不会成为每个中间工件死去的地方。附肢可以为任务携带本地工作记忆。前台可以携带关系、当前意图和综合信息。这也使得压缩变得相当明显。每个通道在一定阈值上持续异步压缩，如果由于某种奇怪的事件，它超过另一个更高的阈值，则同步压缩。由此设计带来的好处平均交互时间是目标。完成可能需要一段时间。通道可以阅读文档、等待 I/O、运行测试、遇到障碍并重新尝试，这是可以的。因为一个附肢忙于工作，前台不可以变得黑暗。因此，前台通道必须保持小而无趣：稳定的提示、当前意图、最近的表面活动、紧凑的摘要和引用证据。