返回

文章详情

开放权重模型的不可忍受的廉价

Hacker News2026年6月25日 02:51

今天我在设置Hermes以查看它在网络研究中的表现。我选择了DeepSeek V4,因为我知道它价格便宜,但看到它的定价与Anthropic和OpenAI的‘前沿’模型相比真是不可思议。仅基于令牌,价格几乎增长了50倍,更不用说他们的任何模型在思考中可能消耗多少令牌(针对相同任务使用更多令牌)。我对此感到担忧的是,Anthropic和OpenAI似乎把自己逼入了高成本的角落。他们能合理地将价格降低20-50倍以便与DeepSeek或小米的Mimo竞争吗?开放权重与低成本 这些模型是廉价的,因为它们是开放的,有成百上千的人在不同硬件上进行压力测试,从而帮助降低成本吗?还是因为它们作为亏损领导者提供以压低价格?如何保持商品的高价格?你制造稀缺性。你销售奢侈品和高端品牌。这正是OpenAI和Anthropic似乎通过在更高的墙后限制‘前沿’模型的使用所做的。这是奢侈品牌如何长期销售汽车和手袋的方式。它们是真正富人的俱乐部和地位象征,而不打算广泛分发。Anthropic和OpenAI会利用对中国的恐惧来推动对开放权重模型的禁令吗?我几个月来一直担心这个,每过一周似乎都支持这种担忧。如何制造稀缺性?一个简单的方法是制造恐惧,并让政府帮助限制竞争的进入。为什么不竞争呢?美国过去曾是开源的倡导者,我希望美国能够出现严重的开源竞争,证明开放权重和开源模型最终是未来。谷歌Gemma 4于2026年4月发布,Meta有llama,但尚未发布,OpenAI在2025年最后一次发布开放权重GPT模型,至我所知,Anthropic从未发布过任何开放权重模型。 真正的开源与开放权重 我认为开源的跳跃场景将是真正的开源模型,其中训练的数据管道也是开源的。https://allenai.org/olmo -> 你现在可以下载这些模型,它们正在变得越来越受欢迎。尽管如此,它们有点过时,数据截止于2024年12月。展望未来,美国国家科学基金会与Nvidia合作,使Allen AI能够开发真正完全开放的AI: https://www.nsf.gov/news/nsf-nvidia-partnership-enables-ai2-develop-fully-open-ai 附加信息:想深入了解Claude / ChatGPT的技术栈吗?查看他们用于构建iOS和Android应用程序的工具:Claude Android ChatGPT Android 你可以导航到SDK以查看更详细的具体部分以及未映射的SDK路径。

赞助内容

NordVPN Next-gen Antivirus

本站免费、广告极少。如果觉得有帮助,可以请我们喝杯咖啡 —— 任何金额都对持续运营有实际帮助。

请我喝杯咖啡