代币经济学:量化代币在自主软件工程中的使用
查看 PDF HTML(实验)摘要:基于大语言模型的多智能体(LLM-MA)系统正日益应用于自动化复杂的软件工程任务,如需求工程、代码生成和测试。然而,它们的运行效率和资源消耗尚不清楚,导致在实际应用中由于不可预测的成本和环境影响而受到阻碍。为了解决这个问题,我们对软件开发生命周期(SDLC)中的 LLM-MA 系统中的代币消耗模式进行了分析,旨在了解代币在不同的软件工程活动中如何被消耗。我们分析了 ChatDev 框架使用 GPT-5 推理模型执行的 30 个软件开发任务的执行轨迹,将其内部阶段映射到不同的开发阶段(设计、编码、代码完成、代码审查、测试和文档),以创建一个标准化的评估框架。然后,我们量化并比较这些阶段的代币分布(输入、输出、推理)。我们初步发现,迭代的代码审查阶段占据了代币消耗的主要部分,平均占 59.4%。此外,我们观察到输入代币通常占消耗的最大份额,平均为 53.9%,为自主协作中潜在的重大低效提供了实证证据。我们的结果表明,自主软件工程的主要成本不在于初始代码生成,而在于自动化的细化和验证。我们的新方法可以帮助从业人员预测费用和优化工作流程,并指导未来的研究朝向开发更具代币效率的代理协作协议。主题:软件工程(cs.SE);人工智能(cs.AI);多智能体系统(cs.MA)引用为:arXiv:2601.14470 [cs.SE](或arXiv:2601.14470v1 [cs.SE]为此版本) https://doi.org/10.48550/arXiv.2601.14470 arXiv 发布的 DOI 通过 DataCite 提交历史 来自:Mohamad Salim [查看电子邮件] [v1] 2026年1月20日星期二 20:52:14 UTC (302 KB)
本站免费、广告极少。如果觉得有帮助,可以请我们喝杯咖啡 —— 任何金额都对持续运营有实际帮助。
☕请我喝杯咖啡