論文の概要: YOLO-DS: Fine-Grained Feature Decoupling via Dual-Statistic Synergy Operator for Object Detection
- arxiv url: http://arxiv.org/abs/2601.18172v1
- Date: Mon, 26 Jan 2026 05:50:32 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-27 15:23:08.694932
- Title: YOLO-DS: Fine-Grained Feature Decoupling via Dual-Statistic Synergy Operator for Object Detection
- Title(参考訳): YOLO-DS:オブジェクト検出のための双統計相乗演算子による細粒化特徴デカップリング
- Authors: Lin Huang, Yujuan Tan, Weisheng Li, Shitai Shan, Liu Liu, Bo Liu, Linlin Shen, Jing Yu, Yue Niu,
- Abstract要約: DSO(Dual-Statistic Synergy Operator)を中心に構築されたYOLO-DSを提案する。
YOLO-DSは、チャネル平均とピーク平均差を共同でモデル化することにより、オブジェクトの特徴を分離する。
MS-COCOベンチマークでは、YOLO-DSは5つのモデルスケールでYOLOv8を上回っている。
- 参考スコア(独自算出の注目度): 55.58092342624062
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: One-stage object detection, particularly the YOLO series, strikes a favorable balance between accuracy and efficiency. However, existing YOLO detectors lack explicit modeling of heterogeneous object responses within shared feature channels, which limits further performance gains. To address this, we propose YOLO-DS, a framework built around a novel Dual-Statistic Synergy Operator (DSO). The DSO decouples object features by jointly modeling the channel-wise mean and the peak-to-mean difference. Building upon the DSO, we design two lightweight gating modules: the Dual-Statistic Synergy Gating (DSG) module for adaptive channel-wise feature selection, and the Multi-Path Segmented Gating (MSG) module for depth-wise feature weighting. On the MS-COCO benchmark, YOLO-DS consistently outperforms YOLOv8 across five model scales (N, S, M, L, X), achieving AP gains of 1.1% to 1.7% with only a minimal increase in inference latency. Extensive visualization, ablation, and comparative studies validate the effectiveness of our approach, demonstrating its superior capability in discriminating heterogeneous objects with high efficiency.
- Abstract(参考訳): 一段物検出、特にYOLOシリーズは精度と効率のバランスが良い。
しかし、既存のYOLO検出器は、共有特徴チャネル内の異種オブジェクト応答の明示的なモデリングを欠いているため、さらなる性能向上が制限されている。
そこで我々は,新しいDual-Statistic Synergy Operator (DSO) を中心に構築されたYOLO-DSを提案する。
DSOは、チャネル平均とピーク平均差を共同でモデル化することにより、オブジェクトの特徴を分離する。
DSOに基づいて、適応的なチャネルワイド特徴選択のためのDual-Statistic Synergy Gating (DSG)モジュールと、深さワイド特徴重み付けのためのMulti-Path Segmented Gating (MSG)モジュールの2つの軽量ゲーティングモジュールを設計する。
MS-COCOベンチマークでは、YOLO-DSは5つのモデルスケール(N, S, M, L, X)でYOLOv8を一貫して上回り、AP利得は1.1%から1.7%となり、推論遅延は最小限に抑えられている。
広汎な可視化,アブレーション,および比較研究は,本手法の有効性を検証し,不均一物体を高効率で識別する優れた能力を実証した。
関連論文リスト
- YOLOA: Real-Time Affordance Detection via LLM Adapter [96.61111291833544]
Affordance Detectionは、インボディードAIにおける基本的な"ハウツーハウ"の課題に共同で対処することを目的としている。
本稿では、オブジェクト検出と空き学習を協調的に扱うリアルタイムな空き検出モデルであるYOLO Affordance(YOLOA)を紹介する。
ADG-Det と IIT-Heat のベンチマーク実験により,YOLOA がリアルタイム性能を維持しながら最先端の精度を実現していることが示された。
論文 参考訳(メタデータ) (2025-12-03T03:53:31Z) - YOLOv13: Real-Time Object Detection with Hypergraph-Enhanced Adaptive Visual Perception [58.06752127687312]
高精度で軽量な物体検出器YOLOv13を提案する。
ハイパーグラフに基づく適応相関強化(HyperACE)機構を提案する。
また,FullPAD(Full-Pipeline Aggregation-and-Distribution)パラダイムを提案する。
論文 参考訳(メタデータ) (2025-06-21T15:15:03Z) - YOLO-PRO: Enhancing Instance-Specific Object Detection with Full-Channel Global Self-Attention [38.97680747773625]
本稿では,オブジェクト検出フレームワークにおける従来のボトルネック構造の本質的制約について論じる。
フルチャネルグローバル自己アテンション (ISB) を持つ Instance-Specific Bottleneck と Instance-Specific Asymmetric Decoupled Head (ISADH) の2つの新しいモジュールを提案する。
MS-COCOベンチマークの実験では、YOLO-PROフレームワークにおけるISBとISADHの協調配置により、全ての計算スケールで最先端のパフォーマンスが達成されている。
論文 参考訳(メタデータ) (2025-03-04T07:17:02Z) - YOLOv10: Real-Time End-to-End Object Detection [68.28699631793967]
リアルタイムオブジェクト検出の分野では,YOLOが主流のパラダイムとして浮上している。
非最大抑圧(NMS)による処理後ハマーによるYOLOのエンドツーエンドデプロイメントへの依存。
YOLOの総合的効率-精度駆動型モデル設計戦略を紹介する。
論文 参考訳(メタデータ) (2024-05-23T11:44:29Z) - YOLO-MS: Rethinking Multi-Scale Representation Learning for Real-time Object Detection [63.36722419180875]
YOLO-MSと呼ばれる効率的かつ高性能な物体検出器を提供する。
私たちは、他の大規模なデータセットに頼ることなく、MS COCOデータセット上でYOLO-MSをスクラッチからトレーニングします。
私たちの作業は、他のYOLOモデルのプラグイン・アンド・プレイモジュールとしても機能します。
論文 参考訳(メタデータ) (2023-08-10T10:12:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。