論文の概要: YOLO26: An Analysis of NMS-Free End to End Framework for Real-Time Object Detection
- arxiv url: http://arxiv.org/abs/2601.12882v1
- Date: Mon, 19 Jan 2026 09:36:08 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-21 22:47:22.837905
- Title: YOLO26: An Analysis of NMS-Free End to End Framework for Real-Time Object Detection
- Title(参考訳): YOLO26:リアルタイムオブジェクト検出のためのNMSフリーエンドツーエンドフレームワークの解析
- Authors: Sudip Chakrabarty,
- Abstract要約: You Only Look Once"フレームワークは、長い間リアルタイムオブジェクト検出のベンチマークとして機能してきた。
「YOLO26」アーキテクチャはこのパラダイムを再定義し、NMSを排除し、ネイティブなエンドツーエンド学習戦略を採用した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The "You Only Look Once" (YOLO) framework has long served as the benchmark for real-time object detection, yet traditional iterations (YOLOv1 through YOLO11) remain constrained by the latency and hyperparameter sensitivity of Non-Maximum Suppression (NMS) post-processing. This paper analyzes a comprehensive analysis of YOLO26, an architecture that fundamentally redefines this paradigm by eliminating NMS in favor of a native end-to-end learning strategy. This study examines the critical innovations that enable this transition, specifically the introduction of the MuSGD optimizer for stabilizing lightweight backbones, STAL for small-target-aware assignment, and ProgLoss for dynamic supervision. Through a systematic review of official performance benchmarks, the results demonstrate that YOLO26 establishes a new Pareto front, outperforming a comprehensive suite of predecessors and state-of-the-art competitors (including RTMDet and DAMO-YOLO) in both inference speed and detection accuracy. The analysis confirms that by decoupling representation learning from heuristic post-processing, YOLOv26 successfully resolves the historical trade-off between latency and precision, signaling the next evolutionary step in edge-based computer vision.
- Abstract(参考訳): You Only Look Once"(YOLO)フレームワークは、長い間リアルタイムオブジェクト検出のベンチマークとして機能してきたが、従来のイテレーション(YOLOv1 - YOLO11)は、非最大抑圧(NMS)後処理のレイテンシとハイパーパラメータ感度によって制約を受け続けている。
本稿では,このパラダイムを根本的に再定義するアーキテクチャであるYOLO26の包括的解析を行い,NMSを排除し,ネイティブなエンドツーエンド学習戦略を提案する。
本研究では、この移行を可能にする重要なイノベーション、特に軽量バックボーンの安定化のためのMulSGDオプティマイザの導入、小型ターゲット対応のSTAL、動的監視のためのProgLossについて検討する。
公式なパフォーマンスベンチマークの体系的なレビューを通じて、YOLO26は新しいParetoフロントを確立し、予測速度と検出精度の両方で先駆者と最先端の競合(RTMDetやDAMO-YOLOを含む)の総合的なスイートを上回っていることを示した。
この分析は、ヒューリスティックな後処理から表現学習を分離することで、YOLOv26はレイテンシと精度の間の歴史的なトレードオフを解決し、エッジベースのコンピュータビジョンにおける次の進化のステップを示す。
関連論文リスト
- YOLO-IOD: Towards Real Time Incremental Object Detection [57.862742461237055]
本稿では、事前訓練されたYOLO-Worldモデルに基づいて構築されたリアルタイムインクリメンタルオブジェクト検出(IOD)フレームワークであるYOLO-IODを紹介する。
YOLO-IODは3つの主要な構成要素を含む: 1) 衝突を意識した擬似ラベルリファインメント(CPR)は、前景と背景の混乱を緩和する。
また, クロスステージ非対称な知識蒸留法 (CAKD) を導入する。
論文 参考訳(メタデータ) (2025-12-28T15:35:26Z) - Ultralytics YOLO Evolution: An Overview of YOLO26, YOLO11, YOLOv8 and YOLOv5 Object Detectors for Computer Vision and Pattern Recognition [3.2882817259131403]
本稿では、対象検出器のUltralytics YOLO(You Only Look Once)ファミリーについて概観する。
レビューは、最新のリリースであるYOLO26(またはYOLOv26)から始まる。
本論文は,密接なシーン制限,ハイブリッドCNN-Transformer統合,オープン語彙検出,エッジ認識トレーニングアプローチなど,課題と今後の方向性を明らかにする。
論文 参考訳(メタデータ) (2025-10-06T23:28:44Z) - YOLO26: Key Architectural Enhancements and Performance Benchmarking for Real-Time Object Detection [3.1957907449739764]
本研究は, リアルタイムオブジェクト検出のためのアーキテクチャ拡張と性能ベンチマークについて, Ultralytics YOLO26の包括的解析を行った。
2025年9月にリリースされたYOLO26は、エッジおよび低消費電力デバイスに効率性、正確性、デプロイメントの準備ができているYOLOファミリーの最新のかつ最も先進的なメンバーである。
論文 参考訳(メタデータ) (2025-09-29T17:58:04Z) - A Review of YOLOv12: Attention-Based Enhancements vs. Previous Versions [0.5639904484784127]
YOLOv12は、リアルタイムのパフォーマンスを維持しながら注意ベースの拡張をうまく組み込む、新しいアプローチを導入している。
本稿では、計算効率のよい自己注意領域を含む、YOLOv12のアーキテクチャ革新を包括的にレビューする。
従来のYOLOバージョンと競合するオブジェクト検出器に対してYOLOv12をベンチマークし、精度、推論速度、計算効率の改善点を分析した。
論文 参考訳(メタデータ) (2025-04-16T11:40:55Z) - YOLOv5, YOLOv8 and YOLOv10: The Go-To Detectors for Real-time Vision [0.6662800021628277]
本稿では、YOLOv5, YOLOv8, YOLOv10に着目し、YOLO(You Only Look Once)オブジェクト検出アルゴリズムの進化に焦点を当てた。
これらのバージョンにまたがるエッジデプロイメントのアーキテクチャの進歩、パフォーマンスの改善、適合性を分析します。
論文 参考訳(メタデータ) (2024-07-03T10:40:20Z) - YOLOv10: Real-Time End-to-End Object Detection [68.28699631793967]
リアルタイムオブジェクト検出の分野では,YOLOが主流のパラダイムとして浮上している。
非最大抑圧(NMS)による処理後ハマーによるYOLOのエンドツーエンドデプロイメントへの依存。
YOLOの総合的効率-精度駆動型モデル設計戦略を紹介する。
論文 参考訳(メタデータ) (2024-05-23T11:44:29Z) - It Is Time To Steer: A Scalable Framework for Analysis-driven Attack Graph Generation [50.06412862964449]
アタックグラフ(AG)は、コンピュータネットワークに対するマルチステップ攻撃に対するサイバーリスクアセスメントをサポートする最も適したソリューションである。
現在の解決策は、アルゴリズムの観点から生成問題に対処し、生成が完了した後のみ解析を仮定することである。
本稿では,アナリストがいつでもシステムに問い合わせることのできる新しいワークフローを通じて,従来のAG分析を再考する。
論文 参考訳(メタデータ) (2023-12-27T10:44:58Z) - Reparameterized Variational Divergence Minimization for Stable Imitation [57.06909373038396]
確率的発散の選択における変動が、より高性能なILOアルゴリズムをもたらす可能性について検討する。
本稿では,提案する$f$-divergence最小化フレームワークの課題を軽減するために,逆模倣学習のための再パラメータ化手法を提案する。
経験的に、我々の設計選択は、ベースラインアプローチより優れ、低次元連続制御タスクにおける専門家のパフォーマンスとより密に適合するIOOアルゴリズムを許容することを示した。
論文 参考訳(メタデータ) (2020-06-18T19:04:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。