返回

文章详情

YOLO26简介

Hacker News2026年6月23日 01:52

YOLO26 是一个端到端的目标检测和多任务模型系列,支持检测、实例分割、姿态估计、定向目标检测和图像分类,涵盖从纳米到超大五种尺寸变体。它于2026年1月发布,去除了非最大抑制以降低延迟,并去掉了分布聚焦损失模块,以更好地兼容边缘和低功耗硬件。本文涵盖了架构、COCO基准结果、下载链接,以及与 RF-DETR、LW-DETR 和 D-FINE 等模型的比较。YOLO 模型是一个实时计算机视觉模型系列,旨在处理广泛的任务,包括目标检测、分割、姿态估计、分类和定向目标检测。利用流行的架构,这些模型提供了卓越的速度和精度,使其非常适合于边缘设备、云 API 等应用。在这篇博客中,我们将检查于2026年1月发布的 YOLO26,揭示其主要改进、重要特性,以及它与其他领先计算机视觉模型的比较。💡 Roboflow 支持 YOLO26 的标注、训练和部署,了解更多。什么是 YOLO26?YOLO26 是一个多任务模型系列,旨在处理广泛的计算机视觉任务,包括目标检测、实例分割、图像分类、姿态估计和定向目标检测。该系列提供多种尺寸变体:纳米(N)、小(S)、中(M)、大(L)和超大(X),以满足不同的性能和部署需求。与之前的 YOLO 版本相比,YOLO26 针对边缘部署进行了优化,具有更快的 CPU 推理、更加紧凑的模型设计和简化的架构,以提高不同硬件环境的兼容性。显著改进包括通过去除 NMS 来降低延迟,并且在 fp16 和 fp32 中结果保持一致,从而使模型以优化、低延迟的方式运行时也能获得与训练期间相同的高精度。⚡ RF-DETR 神经架构搜索(NAS)比 YOLO26 更快且更准确。点击此处查看博客文章。尝试在图像上使用 YOLO26 查看 YOLO26 在 COCO 数据集中常见物体的表现。测试模型如何处理您的数据。下载 YOLO26 下表提供 YOLO26 的下载链接,以及 Ultralytics 报告的 YOLO26 模型系列性能基准,与从纳米到超大不同变体在准确性(mAP)、延迟和计算成本等关键指标上的比较。模型大小(像素) mAP val 50-95 CPU 上速度 ONNX (ms) T4 TensorRT10 上速度 (ms) 参数 (M) FLOPs (B) YOLO26n 640 40.9 38.9 ± 0.7 1.7 ± 0.0 2.4 5.4 YOLO26s 640 48.6 87.2 ± 0.9 2.5 ± 0.0 9.5 20.7 YOLO26m 640 53.1 220.0 ± 1.4 4.7 ± 0.1 20.4 68.2 YOLO26l 640 55.0 286.2 ± 2.0 6.2 ± 0.2 24.8 86.4 YOLO26x 640 57.5 525.8 ± 4.0 11.8 ± 0.2 55.7 193.9 此比较突出了推理速度和检测精度之间的权衡,使您能够根据具体硬件限制选择最佳模型大小。有关其他模型任务类型,请访问 YOLO26 GitHub。YOLO26 架构 YOLO26 引入了一些重大改进,包括:更广泛的设备支持:去除了分布聚焦损失(DFL)模块,简化了推理,支持多种导出格式(TFLite、CoreML、OpenVINO、TensorRT 和 ONNX),并扩大了对边缘和低功耗设备的支持。增强小物体识别:利用 ProgLoss 和 STAL 损失函数,提高了检测精度,特别是对于小物体,为物联网、机器人和航空影像应用提供了显著优势。端到端预测:消除了非最大抑制(NMS)作为后处理步骤,直接产生预测以降低延迟,使在现实系统中的部署更快、更轻、更可靠。更快的 CPU 推理:模型设计和训练的优化使 YOLO26 在 CPU 上比 YOLO11 更快。例如,YOLO26-N 变体比 YOLO11-N 提供高达 43% 更快的 CPU 推理,使 YOLO26 在没有 GPU 的设备上理想于实时性能。改进的训练:引入了 MuSGD 优化器,结合了 SGD 和受到 Kimi K2 LLM 突破启发的 Muon,通过将大型语言模型的优化进展转移到计算机视觉中,确保稳定训练和更快收敛。YOLO26 替代品 除了 YOLO26,还有其他多个多任务计算机视觉模型在目标检测排行榜上积极使用和基准测试。RF-DETR RF-DETR 是 Roboflow 开发的,于 2025 年 3 月发布,是一系列支持分割、目标检测和分类任务的实时检测模型。RF-DETR 在基准测试中超越了 YOLO26,展示了跨领域的优越泛化能力。RF-DETR 足够小,可以在边缘使用推理,

赞助内容

NordVPN Next-gen Antivirus

本站免费、广告极少。如果觉得有帮助,可以请我们喝杯咖啡 —— 任何金额都对持续运营有实际帮助。

请我喝杯咖啡