返回

文章详情

JPEG XL 之旅:开源实验塑造了图像编码的未来

Hacker News2026年6月3日 21:55

作者:Jyrki Alakuijala, Zoltán Szabadka 和 Luca Versari,智能范式,谷歌科技与社会 构建下一代图像标准 互联网以图像为基础。自网络早期起,视觉保真度与带宽之间就一直存在着无法避免的矛盾。几十年来,业界依赖于值得信赖的 JPEG 标准来实现快速加载图像。它为我们服务得相当好,但随着显示器转向高动态范围(HDR)和广色域(WCG),该格式开始显露出其局限性。JPEG XL(JXL)的发展并非一帆风顺。它是一段长达十年的探索,创造了一系列开创性项目,测试心理视觉建模、熵编码和优化中的激进想法。今天,随着 JPEG XL 在各大操作系统和专业标准中的迅速采用,我们回顾了使这一切成为可能的实验。 早期基础:2011-2017年 我们的研究始于理解现有技术的局限性。我们并不是从编写新标准开始;而是从改善当前标准及学习其局限性开始。这使我们能够在合适的地方使新形式更灵活和高效。 WebP 无损和 Brotli:有损 WebP 源于视频技术,而 WebP 无损(2011)则代表着一种架构和范围的转变。我们首次推出了熵图像概念,一种利用二次图像协调静态熵编码选择的创新方法。我们在 Brotli 压缩格式中重新应用了这一方法,通过数据驱动的上下文建模,实现丰富的上下文建模而不会减慢解码速度。 Butteraugli:大约在2014年,我们意识到单纯的数学压缩(PSNR)不足以应对简单的心理视觉近似(如 SSIM 等)在色彩丰富的环境中无法有效工作。我们构建了 Butteraugli 和 XYB 颜色空间,以模仿人类视觉系统在不同尺度下的边缘检测和对立色彩过程,从而更有效地压缩图像。通过两个关键项目:Guetzli 和 Brunsli,我们推动了传统 JPEG 1 标准(ISO/IEC 10918,1992年引入)至其绝对极限。这些项目为传统 JPEG 压缩方法的优势和局限性提供了宝贵的见解。Guetzli(2016年)是一个慢速高密度感知编码器,利用 Butteraugli 查找最佳量化表,使传统 JPEG 文件变得小 20-30%。Brunsli(2015年)则专注于无损重新压缩,允许用户在不丢失原始数据的情况下,将现有 JPEG 重新打包成更小的占用空间。在完成 JPEG XL 标准化后,我们在2024年重新回到 Guetzli 的范围,并使编码速度大大加快,并兼容 HDR。来自这些发布的反馈,从 WebP 无损的技术细节到 Guetzli 的心理视觉审计,都证明是不可或缺的。虽然我们已针对最高的视觉保真度,但来自细节要求严格的电子商务的反馈帮助我们进一步完善了需求。 融合期:2017-2019年 PIK 时代和 2019 年 FUIF 集成 到2017年,我们拥有强大的独立工具,现在是将它们融合的时候了。在开源 PIK 时,我们将 Brunsli 的效率与 Guetzli 的心理视觉优化相结合。此外,PIK 引入了真正的自适应量化字段和其他优化。PIK 形成了我们向 ISO 标准化机构提出的建议。委员会对提案的最终呼吁推动了极端的密度,要求比特率低至 0.06 BPP,相当于互联网质量图像的 35 倍压缩,和相机输出的 80 倍。这种范围的扩展要求格式和编码器的复杂程度显著增加,导致了今天 JPEG XL 中核心的可变块大小离散余弦变换(VarDCT)架构。我们提议将我们的 PIK 提案与 Cloudinary 的 FUIF(自由通用图像格式)提案合并。PIK 在编码时采用 Brotli 风格的分发选择,而 FUIF 在解码过程中逐步细化代码。最终的 JPEG XL 标准成为了一种双赢的折中:我们使用 PIK 更快解码的分发选择与 FUIF 的复杂上下文树。此次合并代表着与传统单一平台驱动标准化的脱离,优先考虑技术协同和合作。 今天的 JPEG XL:一个生态系统的扎根 JPEG XL 的效率、心理视觉优化的质量、文件大小和编码速度都引起了关注。我们在多个行业中看到了自下而上的采用,最具挑战性的领域走在前列。由于其能够有效而稳健地处理高比特深度、高质量甚至无损数据,JPEG XL 已成为几个领域的基础: 摄影:用于数字负片(DNG 1.7)、苹果的 ProRAW 等。 医学:被 DICOM 采用,国际上

赞助内容

NordVPN Next-gen Antivirus

本站免费、广告极少。如果觉得有帮助,可以请我们喝杯咖啡 —— 任何金额都对持续运营有实际帮助。

请我喝杯咖啡