返回

文章详情

统一可控且忠实的文本到 CAD 生成

Hacker News2026年6月9日 14:04

查看 PDF HTML(实验性)摘要:CAD 模型的构建传统上依赖于劳动密集型手动操作和专业知识。近年来,大型语言模型(LLMs)的进展激发了文本到 CAD 生成的研究。然而,现有的方法通常将生成与编辑视为不相干的任务,限制了它们的实用性。我们提出了 PR-CAD,这是一种渐进式改进框架,将可控且忠实的文本到 CAD 建模的生成与编辑统一起来。为此,我们策划了一个高保真互动数据集,涵盖整个 CAD 生命周期,包括多种 CAD 表示以及定性和定量描述。该数据集系统性地定义了编辑操作的类型,并生成高度人类化的互动数据。在一个针对 LLM 量身定制的 CAD 表示基础上,我们提出了一种增强学习的推理框架,将意图理解、参数估计和精确编辑定位整合到一个单一代理中。这使得设计创作和改进的“一体化”解决方案成为可能。 extensive 实验表明生成与编辑任务之间的强相互增强,以及跨定性和定量模态的表现。在公共基准测试中,PR-CAD 在生成和改进场景下实现了最先进的可控性和忠实性,同时也证明了用户友好性,并显著提高了 CAD 建模的效率。主题:计算与语言(cs.CL);人工智能(cs.AI)引用为:arXiv:2604.19773 [cs.CL](或 arXiv:2604.19773v1 [cs.CL] 作为此版本)https://doi.org/10.48550/arXiv.2604.19773 arXiv 发布的 DOI 通过 DataCite 提交历史来自:Jiyuan An [查看电子邮件] [v1] 2026年3月27日星期五 12:13:20 UTC (10,655 KB)

赞助内容

NordVPN Next-gen Antivirus

本站免费、广告极少。如果觉得有帮助,可以请我们喝杯咖啡 —— 任何金额都对持续运营有实际帮助。

请我喝杯咖啡