代币经济学：量化代币在自主软件工程中的使用

查看 PDF HTML（实验）摘要：基于大语言模型的多智能体（LLM-MA）系统正日益应用于自动化复杂的软件工程任务，如需求工程、代码生成和测试。然而，它们的运行效率和资源消耗尚不清楚，导致在实际应用中由于不可预测的成本和环境影响而受到阻碍。为了解决这个问题，我们对软件开发生命周期（SDLC）中的 LLM-MA 系统中的代币消耗模式进行了分析，旨在了解代币在不同的软件工程活动中如何被消耗。我们分析了 ChatDev 框架使用 GPT-5 推理模型执行的 30 个软件开发任务的执行轨迹，将其内部阶段映射到不同的开发阶段（设计、编码、代码完成、代码审查、测试和文档），以创建一个标准化的评估框架。然后，我们量化并比较这些阶段的代币分布（输入、输出、推理）。我们初步发现，迭代的代码审查阶段占据了代币消耗的主要部分，平均占 59.4%。此外，我们观察到输入代币通常占消耗的最大份额，平均为 53.9%，为自主协作中潜在的重大低效提供了实证证据。我们的结果表明，自主软件工程的主要成本不在于初始代码生成，而在于自动化的细化和验证。我们的新方法可以帮助从业人员预测费用和优化工作流程，并指导未来的研究朝向开发更具代币效率的代理协作协议。主题：软件工程（cs.SE）；人工智能（cs.AI）；多智能体系统（cs.MA）引用为：arXiv:2601.14470 [cs.SE]（或arXiv:2601.14470v1 [cs.SE]为此版本） https://doi.org/10.48550/arXiv.2601.14470 arXiv 发布的 DOI 通过 DataCite 提交历史来自：Mohamad Salim [查看电子邮件] [v1] 2026年1月20日星期二 20:52:14 UTC (302 KB)