最佳的松弛量不为零
后悔你觉得不错的代码吗?了解跳过人工审查何时是聪明的决定,何时不是。严格性应与风险成比例。我的常规读者可能会对这篇文章的标题感到震惊。如果你读过我的其他文章,如《AI:加速无能》或《大语言模型不是心灵的自行车》,你可能会期待我宁愿错过我儿子的生日,也不愿意发布未经审核的大语言模型代码。你说得并不远:我仅在几种狭窄情况下这样做。今天你将了解到这些情况,以及我在跳过代码审核时的决策标准。注意定义:代理编程:大语言模型为你编辑、运行和测试代码的循环。氛围编程:在不阅读的情况下接受大语言模型生成的代码。松弛:低质量、高数量的人工智能生成内容。 眼见为虚。逐月,我遇到越来越多发现代理编程并且对其非常信任的人,他们现在不仅将软件实施外包给它,还将验证工作也外包给它。就在昨天,我和一位开发人员聊天,他说他已经停止审核代码。他让一组大语言模型代理为他处理这件事。我感到失望,因为他应该理解软件这种令人困扰的特性:外部可观察的外观和行为对内部质量几乎没有信号。一个程序即使满足所有期望,仍然可能充满质量问题。它今天能正常工作,但在被修改且周围环境变化时可能会崩溃。作为Claude Code的日常用户,我可以证明,当给出明确的要求和背景时,它通常能够生成真正满足我请求的软件。然而,在数百次会话中,这段代码从未被我称作好过,即使在逆向大语言模型审核之后。闭源软件既是一种经验之物,也是一种信任之物。我们都购买过某些可下载的软件或订阅过SaaS。在购买之前,你评估过该软件是否满足你的需求,但作为潜在客户,你没有办法评估其实现的质量。你只能依赖于外部特征。如果存在安全缺陷,你无法发现它。像SOC 2这样的认证旨在重新平衡开发者与客户之间的信息不对称。如果你,作为开发者,将阅读代码的工作外包给大语言模型,那么你就放弃了信息优势,没有提供比非从业者更多的价值。我们知道软件是一种信任之物的证明是:给一个高管一个外观光鲜的原型,他们就准备为此支票上写下数百万。实际上,你所做的只是给他们提供了一张还没有首映日期的电影海报。这就是为什么好的原型刻意看起来不完善的原因。过于精致的模型和原型故意看起来像铅笔素描,因为没有哪个高管会说“现在就发货。”程序员拥有一般人没有的能力:审核大语言模型生成的代码。这是一种宝贵的优势,但内部代码质量却以稀缺资源时间和注意力作为代价。何时值得付出努力?我们所寻找的是正确的风险-严格比率。在任何情况下,决定要多么严格时,我们必须考虑事情出错可能带来的成本。如果成本足够低,我们就不必进行严格审查,但如果成本足够高,我们就应该这样做。让我告诉你两个让人误解这个的故事。过于严格。想象一个反乌托邦的未来,汉堡包极为珍贵。犯罪团伙经常偷窃、洗钱,并转售汉堡包。当你走进麦当劳时,你需要通过金属探测器,并接受快速搜查。当你点汉堡包时,收银员严肃地要求出示你的政府签发的带照片的身份证。在这个严峻的世界里,这种极端的措施是为了通过保护避免损失来最大化麦当劳的利润。在现实世界中,这个故事是一则可笑的虚构,因为严格性远远超过了风险。汉堡的价格将是十倍,麦当劳也不会出售太多。在足够的风险水平下,这些激进的安全措施完全落入了Overton窗口:在世界上每一个商业机场都是常规做法。 过于不严格。让我们换个故事,展示过于不严格的执行。电影《谎言的发明》(2009)发生在一个从未有人说谎的世界。主角马克·贝利森,由瑞奇·热维斯扮演,正处于困境:他快要被驱逐,因为他无法支付房租。失落的他,准备无家可归,走进他当地的银行分行,请求关闭他的账户。出纳员答复说,不巧的是,计算机系统出现故障,她无法关闭账户,但如果马克能告诉她他的余额,她可以立即提取一笔。账户余额为300美元,但马克突然有了一个顿悟,撒下了世界上第一个谎言:“我有800美元在我的账户中。
本站免费、广告极少。如果觉得有帮助,可以请我们喝杯咖啡 —— 任何金额都对持续运营有实际帮助。
☕请我喝杯咖啡