論文の概要: MDS-DETR: DETR with Masked Duplicate Suppressor
- arxiv url: http://arxiv.org/abs/2605.23507v1
- Date: Fri, 22 May 2026 11:10:17 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-25 17:29:20.326159
- Title: MDS-DETR: DETR with Masked Duplicate Suppressor
- Title(参考訳): MDS-DETR:masked Duplicate Suppressorを用いたDETR
- Authors: Chanho Lee, Seunghee Koh, Yunho Jeon, Junmo Kim,
- Abstract要約: Masked Duplicate Suppressor (MDS)は、自信に基づく因果マスクによって非対称性を自己注意に注入する。
MDS-DETRは、MS-DETR、MR.DETR、Relation-DETRのような既存の1対多のDETRよりも優れており、追加のクエリや補助デコーダに依存しない。
- 参考スコア(独自算出の注目度): 12.073668006425981
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The DEtection TRansformer (DETR) is a powerful end-to-end object detector, yet its one-to-one matching strategy suffers from slow convergence and low recall. A common approach to address this issue is to use one-to-many label assignment to provide more positive samples. However, existing methods that use one-to-many matching as an auxiliary objective lead to increased training costs, with their auxiliary decoders discarded during inference. To address this limitation, we propose MDS-DETR, which leverages both one-to-one and one-to-many supervision within a single decoder. Specifically, we introduce a Masked Duplicate Suppressor (MDS) that injects asymmetry into self-attention via confidence-based causal masking. MDS filters out the duplicates generated by the one-to-many supervised layer, enables explainable, duplicate-free predictions in a fully end-to-end framework. MDS-DETR outperforms existing one-to-many DETR variants such as MS-DETR, MR.DETR and Relation-DETR, without relying on any additional queries or auxiliary decoders. Under a 12-epoch training schedule on MS COCO with a ResNet-50 backbone, MDS-DETR achieves a +2.8 mAP improvement over Deformable-DETR with only a 5\% increase in training time, and outperforms the state-of-the-art MR.DETR by +0.3 mAP while being even 20\% faster in training. Our code and models are available at \href{https://github.com/dcholee/mds-detr}{https://github.com/DChoLee/MDS-DETR}.
- Abstract(参考訳): Detection TRansformer (DETR) は強力なエンドツーエンドの物体検出器であるが、その1対1のマッチング戦略は収束が遅く、リコールが低くなる。
この問題に対処するための一般的なアプローチは、よりポジティブなサンプルを提供するために1対多のラベル割り当てを使用することである。
しかし,1対1のマッチングを補助目的とする既存の手法は,推論中に補助デコーダを破棄するなど,トレーニングコストの増大につながる。
この制限に対処するために、単一デコーダ内で1対1と1対1の両方の監視を利用するMDS-DETRを提案する。
具体的には、自信に基づく因果マスキングにより非対称性を自己注意に注入するMasked Duplicate Suppressor (MDS)を導入する。
MDSは、一対多の監視層によって生成された重複をフィルタリングし、完全にエンドツーエンドのフレームワークで説明可能な、重複のない予測を可能にする。
MDS-DETRは、MS-DETR、MR.DETR、Relation-DETRのような既存の1対多のDETRよりも優れており、追加のクエリや補助デコーダに依存しない。
MDS-DETRは、ResNet-50のバックボーンでMS COCO上で12エポックなトレーニングスケジュールの下で、Deformable-DETRに対して+2.8mAPの改善を実現し、トレーニング時間はわずか5.%増加し、トレーニングの20.%も高速でありながら最先端のMR.DETRを+0.3mAP上回る。
私たちのコードとモデルは、 \href{https://github.com/dcholee/mds-detr}{https://github.com/DChoLee/MDS-DETR}で利用可能です。
関連論文リスト
- DiffGRM: Diffusion-based Generative Recommendation Model [63.35379395455103]
ジェネレーティブレコメンデーション(GR)は、トークン化器を介して各項目をn桁のセマンティックID(SID)として表現する新興パラダイムである。
自己回帰デコーダをマスク付き離散拡散モデル(MDM)に置き換える拡散ベースGRモデルDiffGRMを提案する。
実験では、複数のデータセットに対する強力な生成的および差別的推奨ベースラインよりも一貫した利得を示す。
論文 参考訳(メタデータ) (2025-10-21T03:23:32Z) - MS-DETR: Efficient DETR Training with Mixed Supervision [74.93329653526952]
MS-DETRは、推論に使用されるプライマリデコーダのオブジェクトクエリを1対1で監視する。
このアプローチではデコーダのブランチやオブジェクトクエリを追加する必要はありません。
実験結果から,本手法はDETRの変種よりも優れていることがわかった。
論文 参考訳(メタデータ) (2024-01-08T16:08:53Z) - FeatAug-DETR: Enriching One-to-Many Matching for DETRs with Feature
Augmentation [48.94488166162821]
1対1のマッチングは、DETRのようなオブジェクト検出フレームワークにおいて重要な設計である。
画像や画像の特徴を拡大する異なる視点から一対一マッチングを実現する2つの手法を提案する。
提案手法の有効性を評価するため, 広範囲な実験を行った。
論文 参考訳(メタデータ) (2023-03-02T18:59:48Z) - Semantic-Aligned Matching for Enhanced DETR Convergence and Multi-Scale
Feature Fusion [95.7732308775325]
提案したDetection TRansformer (DETR) は、オブジェクト検出のための完全なエンドツーエンドパラダイムを確立している。
DETRは遅いトレーニング収束に悩まされており、様々な検出タスクの適用性を妨げている。
我々は,DETRの収束を加速し,検出性能を向上させるためにセマンティック・アラインド・マッチDreTR++を設計する。
論文 参考訳(メタデータ) (2022-07-28T15:34:29Z) - Group DETR: Fast DETR Training with Group-Wise One-to-Many Assignment [80.55064790937092]
複数の予測に1つの基幹オブジェクトを割り当てる1対多の割り当ては、より高速なR-CNNやFCOSのような検出方法に成功している。
グループDETR(Group DETR)は、単純だが効率的なDECRトレーニング手法であり、一対多の割り当てのためのグループワイドな方法を導入する。
実験により、グループDETRはトレーニング収束を著しく高速化し、様々なDETRモデルの性能を向上させることが示された。
論文 参考訳(メタデータ) (2022-07-26T17:57:58Z) - DETRs with Hybrid Matching [21.63116788914251]
1対1のセットマッチングは、DETRがエンドツーエンドの機能を確立するための鍵となる設計である。
本稿では,従来の1対1のマッチングブランチと,トレーニング中に補助的な1対1のマッチングブランチを組み合わせるハイブリッドマッチング方式を提案する。
論文 参考訳(メタデータ) (2022-07-26T17:52:14Z) - A Free Lunch to Person Re-identification: Learning from Automatically
Generated Noisy Tracklets [52.30547023041587]
非教師付きビデオベース再識別(re-ID)手法は、re-IDデータセットのアノテートに必要な高コストの問題を解決するために提案されている。
しかし、彼らのパフォーマンスは監督対象よりもはるかに低い。
本稿では,自動生成人追跡装置から再IDモデルを学習することで,この問題に対処することを提案する。
論文 参考訳(メタデータ) (2022-04-02T16:18:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。