开放权重模型的不可忍受的廉价

今天我在设置Hermes以查看它在网络研究中的表现。我选择了DeepSeek V4，因为我知道它价格便宜，但看到它的定价与Anthropic和OpenAI的‘前沿’模型相比真是不可思议。仅基于令牌，价格几乎增长了50倍，更不用说他们的任何模型在思考中可能消耗多少令牌（针对相同任务使用更多令牌）。我对此感到担忧的是，Anthropic和OpenAI似乎把自己逼入了高成本的角落。他们能合理地将价格降低20-50倍以便与DeepSeek或小米的Mimo竞争吗？开放权重与低成本这些模型是廉价的，因为它们是开放的，有成百上千的人在不同硬件上进行压力测试，从而帮助降低成本吗？还是因为它们作为亏损领导者提供以压低价格？如何保持商品的高价格？你制造稀缺性。你销售奢侈品和高端品牌。这正是OpenAI和Anthropic似乎通过在更高的墙后限制‘前沿’模型的使用所做的。这是奢侈品牌如何长期销售汽车和手袋的方式。它们是真正富人的俱乐部和地位象征，而不打算广泛分发。Anthropic和OpenAI会利用对中国的恐惧来推动对开放权重模型的禁令吗？我几个月来一直担心这个，每过一周似乎都支持这种担忧。如何制造稀缺性？一个简单的方法是制造恐惧，并让政府帮助限制竞争的进入。为什么不竞争呢？美国过去曾是开源的倡导者，我希望美国能够出现严重的开源竞争，证明开放权重和开源模型最终是未来。谷歌Gemma 4于2026年4月发布，Meta有llama，但尚未发布，OpenAI在2025年最后一次发布开放权重GPT模型，至我所知，Anthropic从未发布过任何开放权重模型。真正的开源与开放权重我认为开源的跳跃场景将是真正的开源模型，其中训练的数据管道也是开源的。https://allenai.org/olmo -> 你现在可以下载这些模型，它们正在变得越来越受欢迎。尽管如此，它们有点过时，数据截止于2024年12月。展望未来，美国国家科学基金会与Nvidia合作，使Allen AI能够开发真正完全开放的AI: https://www.nsf.gov/news/nsf-nvidia-partnership-enables-ai2-develop-fully-open-ai 附加信息：想深入了解Claude / ChatGPT的技术栈吗？查看他们用于构建iOS和Android应用程序的工具：Claude Android ChatGPT Android 你可以导航到SDK以查看更详细的具体部分以及未映射的SDK路径。