返回

文章详情

关于DeepSeek的笔记

Hacker News2026年6月10日 14:03

关于DeepSeek的笔记:我们上周二访问了公司总部。DeepSeek成立于2023年,由梁文丰创办,直到最近一直在他的对冲基金High-Flyer下运营。该公司于2025年1月发布了他们的R1模型,因此看到他们在做什么非常有趣。公司位于杭州的一栋未标记的12层大楼中。从街道或大厅看不到DeepSeek的品牌标识。我问为什么这样,他们的团队含糊其辞地说:“好吧,这栋大楼里有很多公司,我们并不特别。”他们希望保持低调。我们会见了他们的数据负责人和基础设施负责人。公司只有300名员工,规模至少比Anthropic小一个数量级,并且目前不打算进一步扩大。他们的基础设施负责人尤其年轻,可能只有30岁,显然是全国最佳的AI建设和能源专家之一。(我们简要参观了实验室,每个人似乎都很年轻。讨论很多,感觉这是一个令人兴奋和充满活力的地方。)来自阿里巴巴(Qwen)、字节跳动和Moonshot(Kimi)的竞争正在加剧。在中国,人们似乎主要使用Kimi或DeepSeek。年轻人通过VPN访问Claude,尽管Anthropic在中国的使用上有障碍并且让这一过程变得困难。不同团队之间的挖墙脚行为很常见,就像在美国一样。DeepSeek以聪明和“酷”的声誉著称,也许类似于Anthropic。大实验室大多位于北京,靠近清华大学和北京大学,而杭州是主要的例外(DeepSeek和阿里巴巴/Qwen在这里)。DeepSeek团队阅读西方AI作家的作品。他们收听Dwarkesh的播客,并阅读Gwern。在我们会见的人中,他们表示从未与Anthropic的任何员工见过面。他们根本不担心某种敌对或AGI接管的情景。他们持续提到失业(在中国青年中已经很高)作为他们的主要担忧。当我们问他们是否对他们的模型进行红队测试时,他们说不。在中国,AI模型并没有直接受到监管;政府则对这些模型在软件、服务等中的使用有一些限制。总体而言,中国似乎将AI视为一种普通技术,而不是某种奇点时刻。国家的关注仍然放在基本需求和基础设施建设上,并致力于为人们提供更多药物。“奇点的梦”似乎是一种奢望或遥远的考虑。我们问DeepSeek团队:“至今最大的亮点是什么?你们的退出计划是什么?”他们表示他们的亮点和伟大成就是R1。他们没有提到未来模型或愿景,反而对他们已经取得的成就感到最自豪。他们目前满意于保持在美国公司约6个月的差距,同时保持较低的公众形象和团队规模。

赞助内容

NordVPN Next-gen Antivirus

本站免费、广告极少。如果觉得有帮助,可以请我们喝杯咖啡 —— 任何金额都对持续运营有实际帮助。

请我喝杯咖啡