展示HN:欧洲能否利用其拥有的计算能力训练前沿AI模型?
一个基于来源的模型和关于一个单一问题的简短报告:欧洲能否通过联邦形式整合其已经拥有的公共计算能力,现在建立一个主权的前沿级AI模型,同时,正在计划中的千兆瓦数据中心需要数年才能连接到电网?模型给出的答案是肯定的,作为一种权宜之计。欧洲已经在EuroHPC超级计算机和国家AI工厂中运营着数十个艾克风级的公共AI计算能力。相比之下,一个1GW的校园平均需要7.6年才能等到电网供电。通过低通信(DiLoCo风格)培训进行联邦,欧洲现有的计算能力可以在2028年左右提供一个前沿级模型,而新建的千兆瓦校园大约需要到2033年。首先阅读报告,报告是来自paper/compute-at-home.pdf(从paper/compute-at-home.md构建)。这是一篇面向大众的简短来源阅读。标题是:“我们需要OpenAI还是Anthropic?欧洲在家有数十个艾克风级的计算能力。” repo里包含的内容: euromesh/ ├── README.md ├── requirements.txt ├── paper/ │ ├── compute-at-home.md / .pdf 报告 │ ├── grid_queue_dataset.md 源自1GW与40MW的电网连接时间 │ ├── eurohpc_substrate.md 源自EU公共计算清单 + “是否足够”的数学 │ ├── build_pdf.sh, _report.typ PDF 构建 (pandoc + typst) │ └── figures/ 生成的图表 (PNG + SVG) └── model/ ├── MODEL_SPEC.md 模型规范(方程、参数、不变性) ├── RESULTS.md 完整结果、场景、敏感性、警告 ├── run.py 重新生成每个CSV和图形 ├── src/ 三层模型(效率、增幅、区域) ├── params/ hardware.yaml, training.yaml, regions.csv + SOURCES ├── results/ 生成的CSV(请勿手动编辑) └── tests/ pytest套件(52个测试) + 不变性自检 模型简述:三层。第一层是低通信训练的每FLOP效率(DiLoCo惩罚的代价)。第二层是可用时间(何时启用站点以及累积计算速度)。第三层是按区域的时间、成本、碳排放和可行性评分。头条结果几乎完全由第二层设定:它简化为一个不等式,如果联邦在千兆瓦校园之前上线,其收益是胜利的。训练效率惩罚是二阶的,由敏感性龙卷风确认。 运行它: python3 -m venv .venv .venv/bin/pip install -r requirements.txt .venv/bin/python -m model.run # 重新生成所有CSV和paper/figures中的图形 .venv/bin/python -m pytest model/tests/ # 52个通过 bash paper/build_pdf.sh # 重新构建paper/compute-at-home.pdf(需要pandoc + typst) 从干净的树结构可再现运行:删除每个输出并重新运行,退出0并重新生成所有内容。 数据和来源: 电网连接时间:paper/grid_queue_dataset.md,七个区域,每个区域的主要来源,由AWS“最多七年”的声明和IEA 2至10年的范围作为锚点,并说明限制。 EU公共计算:paper/eurohpc_substrate.md,EuroHPC旗舰项目和19个AI工厂,加速器数量和训练时间的数学。 模型参数:model/params/SOURCES.md和model/params/SOURCES_hardware_training.md,带有置信标签。 诚实的警告:这个repo的重点在于清晰,而不是新颖。其论点建立在电网排队时间的基础上,这些都是源自中心估计而非观察数据(目前没有欧洲运营商激活1GW点负载)。计算能力是拥有的,但尚不能用于协调运行:EuroHPC机器是共享、批量调度和异构的,因此可寻址的部分是一个政治决定,而不是硬件事实。高达约100亿参数的前沿级分布式训练尚未得到证明,因此目标是一个可信的前沿级模型,而不是一个保证的405B。所有这些都在model/RESULTS.md和报告的警告部分中。图形和日期事件截至2026年6月。这是一个独立的模型和分析,未经同行评审。
本站免费、广告极少。如果觉得有帮助,可以请我们喝杯咖啡 —— 任何金额都对持续运营有实际帮助。
☕请我喝杯咖啡