返回

文章详情

本地 Qwen 不是一个更糟的 Opus,它是一种不同的工具

Hacker News2026年6月18日 03:04

我们都听过人们说本地 Qwen 27B 或 35-A3B“接近 Opus 水平”,但我有软件业务和开源项目的凭证,我在这里向你坦诚。这篇文章的形式很长是有原因的。它不是一个草率的观察,也不是关于取消 Claude Max 的毫无根据的说法,也不是一个从每秒 token 数字为个位数、上下文窗口为 32K 的模型运行的爱好者报告。它不是由一位著名 CEO 在飞机上关于编程发推文所写。而是我作为一家小软件企业创始人的历程,在这里,本地模型产生了真实的、有条件的价值。我在这个游戏中有投入,但没有推动云模型或本地模型的动机,并且强烈希望本地模型能够变得强大和可靠。我将介绍这张卡在前两三个月如何自我偿还,它如何持续服务于我们的特定业务用例,为什么我仍然不能放任它自行运行,以及 Qwen 的最糟糕的特性:无限循环和幻觉风险。这些问题在你将它量化缩小到适配消费者 GPU 时最明显。关于 RTX 6000 Pro 的电源连接器的弄清楚 关于我对 AI 的用例 我和作为维护者及创始人的旅程始于 OpenFaaS — 完全手动构建,正如 2016 年之前所有的软件一样。这意味着我独自铺设项目的核心,然后邀请他人通过社区参与 — 不是因为我不能自己做,而是因为我的目标是构建一个成功的开源项目。大约在 2017 年,我试图通过加入 VMware 来资助我的时间,而在 2019 年市场变化后,我需要自己找资金来资助这项工作,因此转向了开放核心并建立了一个自给自足的公司。今天,我们的小团队维护 OpenFaaS、SlicerVM — AI 沙盒和“Linux 的缺失 API”、Actuated.com — 自托管的 GitHub/GitLab CI 运行器,以及 Inlets.com — 自托管的 HTTP/TCP 隧道。这些产品使用非常低级的 Linux 原语,如容器、Kubernetes、Firecracker microVM 和网络协议。如果你眯起眼睛看,它们都是专注于效率、用户体验、控制和自主权的有见地的基础设施产品。它们是用 Go 编写的,有些含有基于 React 的 UI 组件、着陆页面、文档、代理技能和 CLI。除了代码,我们还提供最优质的支持,因为我们灵活并愿意做那些助力客户而不规模化的事情。我使用 AI 工具的时间与它们上市一样长 — 从早期的 VS Code 中的标签补全,经过 ChatGPT 生成代码片段或查找错误,到每天需要待在 tmux 中 12 个小时。我发现自己在 tmux 中待的时间太多,以至于我写了一个免费的工具 Superterm.dev 来跟踪我的会话、笔记,并从编码代理中获得视觉反馈。在这段时间里,我看到功能从“减少样板”提升到“设计、架构并端到端测试”。Claude 或 Codex 完成了我大部分的工作,尽管我坚持要自己写,但我很少手动编写代码——尽管说这个让我很痛苦。前沿智能的转折点 我会说大约在 2025 年 11 月和 2026 年 1 月之间,我们见证了一个转折点。许多开发者在 X 上开始宣称 Claude Opus 发生了变化,现在它能够完成他们所有的工作。人工编码像牛奶放在冰箱外面迅速变坏一样迅速变得糟糕。顶级编码计划的成本大约稳定在每月 200 美元,适合个人。这个数字真的很可观,但对于它们产生的价值而言是可以接受的。即使在今天,如果你避免过多的无人在干活,你可以通过 5 小时的限制,让它持续一周的限制,如果你小心的话。 什么让本地模型有趣 有一种说法是:“为什么要使用低于你所能负担得起的最好的东西?” 2026 年无疑是一个新前沿:我们发现自己处于这样一个地方,在这里,任何想法都可以在一夜之间被你从未听说过的人克隆,尤其是在一个发展中国家。我看到这种情况发生在我们的 SlicerVM 产品(在 2022 年完全手动编写)和 Superterm(2026 年新推出,100% 由编码代理编写)。这并不是说一个 vibe 编码的克隆是一个与有经验团队支持的良好工程和架构解决方案完全等价的,但在一个软件成本几乎为零的市场中——免费和足够好就可以算得上重要了。因此,在这样一个竞争激烈的环境中,为什么要限制自己使用更糟的东西呢?那不是机会成本吗?那不是在冒着你的生计风险吗?有估算显示,领先模型包含 0.5-2T 的参数。这不仅仅是比本地硬件的最佳水平“略多”或“多几倍”——那是处于一个不同的层级。参数数量是能力、知识和推理能力的粗略代理。然而,令人惊讶的是,甚至像 Qwen 3.6 27B 这样的小型密集模型也能在 SWE-Bench Verified 上获得 77.2 的声望基准,而 Claude Opus 4.8 的得分为 88.6%。因此你可能会原谅我在这里出现的...

赞助内容

NordVPN Next-gen Antivirus

本站免费、广告极少。如果觉得有帮助,可以请我们喝杯咖啡 —— 任何金额都对持续运营有实际帮助。

请我喝杯咖啡