返回

文章详情

在游戏GPU的RT核心上运行空间查询的Rust数据库,击败H100

Hacker News2026年6月26日 18:25

在SedonaDB 0.4中,我们教会这个Rust数据库在您$1,500的游戏GPU的光线追踪核心上运行空间连接,并且它超越了H100。Apache Sedona社区发布了SedonaDB 0.4.0,解决了187个问题,并由15位贡献者添加了26个新功能。SedonaDB是第一个将空间数据视为一等公民的开源单节点分析数据库——对应于在单台机器上运行的小到中等数据集的分布式Sedona引擎。这是关于SedonaDB 0.4的新功能系列文章中的第一篇。我们将在后续文章中覆盖更多发布内容——Python DataFrame API,R的dplyr接口,地理信息支持,GeoParquet写入支持,N维栅格和Zarr等;欲了解完整信息,请参阅0.4.0发布博客。我们以我们最兴奋的功能开始:GPU加速的空间连接。GPU加速的空间连接 ¶ 游戏用GPU包含专为视频游戏照明设计的专用光线追踪核心——在数据库查询期间它们处于空闲状态。空间连接涉及查找相交的几何形状,这与光线追踪原始图形自然契合。我们构建了RayBooster,一个将光线追踪核心加速引入SedonaDB的扩展。附带的研究论文“RayBooster: 加速SedonaDB的光线追踪引擎”被VLDB 2026(工业轨道)接受,与俄亥俄州立大学合作开发。它是如何工作的:四个组件 ¶ 1. GPU友好的存储布局。RayBooster使用结构化数组布局而不是面向流的WKB格式,分离偏移量、顶点和类型,使任何几何形状的O(1)随机访问成为可能。 2. 单一的单体索引。它使用Z堆叠,而不是构建数百万个小索引树——将每个几何形状的ID编码到光线追踪场景的未使用Z轴中,并为整个批处理建立一个全局BVH。 3. 一个通用谓词引擎。RelateEngine在RT核心上计算DE-9IM矩阵(一个拓扑描述符),提供一个代码路径以解析任何几何形状/谓词组合,而不是硬编码500多个内核变体。 4. 记忆感知执行。一个调度和溢出层使连接在不规则的现实世界负载的GPU内存预算内,防止内存不足故障。性能 ¶ 在SpatialBench上的测试:重连接的速度提升高达5.93倍,在AWS Q11跨区域三重连接上,成本降低59.02%:7.51秒(CPU)→ 1.61秒在消费级RTX 3090上——4.66倍加速 10倍规模:53.34秒减少到7秒以下 大规模重连接:GPU型号之间的速度提升为4.93倍到9.68倍 消费级RTX 3090与H100:在某些查询中,游戏卡实际击败了H100(在Q10上的1.26秒对1.77秒),尽管H100缺少RT核心 使用方法 ¶ 在配备NVIDIA GPU的机器上,拉取官方Docker镜像,并通过一条命令启用该功能:ctx.sql("SET gpu.enable = true") GPU加速指南介绍了如何在NVIDIA GPU机器上启动Docker镜像,并列出了支持的计算能力。引用 ¶ 梁耕,李如宝,德威·丹宁顿,冯章,贾钰,张晓东。“RayBooster: 加速SedonaDB的光线追踪引擎”。PVLDB,2026(工业轨道)。

赞助内容

NordVPN Next-gen Antivirus

本站免费、广告极少。如果觉得有帮助,可以请我们喝杯咖啡 —— 任何金额都对持续运营有实际帮助。

请我喝杯咖啡