最佳的松弛量不为零

后悔你觉得不错的代码吗？了解跳过人工审查何时是聪明的决定，何时不是。严格性应与风险成比例。我的常规读者可能会对这篇文章的标题感到震惊。如果你读过我的其他文章，如《AI：加速无能》或《大语言模型不是心灵的自行车》，你可能会期待我宁愿错过我儿子的生日，也不愿意发布未经审核的大语言模型代码。你说得并不远：我仅在几种狭窄情况下这样做。今天你将了解到这些情况，以及我在跳过代码审核时的决策标准。注意定义：代理编程：大语言模型为你编辑、运行和测试代码的循环。氛围编程：在不阅读的情况下接受大语言模型生成的代码。松弛：低质量、高数量的人工智能生成内容。眼见为虚。逐月，我遇到越来越多发现代理编程并且对其非常信任的人，他们现在不仅将软件实施外包给它，还将验证工作也外包给它。就在昨天，我和一位开发人员聊天，他说他已经停止审核代码。他让一组大语言模型代理为他处理这件事。我感到失望，因为他应该理解软件这种令人困扰的特性：外部可观察的外观和行为对内部质量几乎没有信号。一个程序即使满足所有期望，仍然可能充满质量问题。它今天能正常工作，但在被修改且周围环境变化时可能会崩溃。作为Claude Code的日常用户，我可以证明，当给出明确的要求和背景时，它通常能够生成真正满足我请求的软件。然而，在数百次会话中，这段代码从未被我称作好过，即使在逆向大语言模型审核之后。闭源软件既是一种经验之物，也是一种信任之物。我们都购买过某些可下载的软件或订阅过SaaS。在购买之前，你评估过该软件是否满足你的需求，但作为潜在客户，你没有办法评估其实现的质量。你只能依赖于外部特征。如果存在安全缺陷，你无法发现它。像SOC 2这样的认证旨在重新平衡开发者与客户之间的信息不对称。如果你，作为开发者，将阅读代码的工作外包给大语言模型，那么你就放弃了信息优势，没有提供比非从业者更多的价值。我们知道软件是一种信任之物的证明是：给一个高管一个外观光鲜的原型，他们就准备为此支票上写下数百万。实际上，你所做的只是给他们提供了一张还没有首映日期的电影海报。这就是为什么好的原型刻意看起来不完善的原因。过于精致的模型和原型故意看起来像铅笔素描，因为没有哪个高管会说“现在就发货。”程序员拥有一般人没有的能力：审核大语言模型生成的代码。这是一种宝贵的优势，但内部代码质量却以稀缺资源时间和注意力作为代价。何时值得付出努力？我们所寻找的是正确的风险-严格比率。在任何情况下，决定要多么严格时，我们必须考虑事情出错可能带来的成本。如果成本足够低，我们就不必进行严格审查，但如果成本足够高，我们就应该这样做。让我告诉你两个让人误解这个的故事。过于严格。想象一个反乌托邦的未来，汉堡包极为珍贵。犯罪团伙经常偷窃、洗钱，并转售汉堡包。当你走进麦当劳时，你需要通过金属探测器，并接受快速搜查。当你点汉堡包时，收银员严肃地要求出示你的政府签发的带照片的身份证。在这个严峻的世界里，这种极端的措施是为了通过保护避免损失来最大化麦当劳的利润。在现实世界中，这个故事是一则可笑的虚构，因为严格性远远超过了风险。汉堡的价格将是十倍，麦当劳也不会出售太多。在足够的风险水平下，这些激进的安全措施完全落入了Overton窗口：在世界上每一个商业机场都是常规做法。过于不严格。让我们换个故事，展示过于不严格的执行。电影《谎言的发明》（2009）发生在一个从未有人说谎的世界。主角马克·贝利森，由瑞奇·热维斯扮演，正处于困境：他快要被驱逐，因为他无法支付房租。失落的他，准备无家可归，走进他当地的银行分行，请求关闭他的账户。出纳员答复说，不巧的是，计算机系统出现故障，她无法关闭账户，但如果马克能告诉她他的余额，她可以立即提取一笔。账户余额为300美元，但马克突然有了一个顿悟，撒下了世界上第一个谎言：“我有800美元在我的账户中。