論文の概要: GroupEnsemble: Efficient Uncertainty Estimation for DETR-based Object Detection
- arxiv url: http://arxiv.org/abs/2603.01847v1
- Date: Mon, 02 Mar 2026 13:26:40 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-03 19:50:56.888793
- Title: GroupEnsemble: Efficient Uncertainty Estimation for DETR-based Object Detection
- Title(参考訳): GroupEnsemble:DETRに基づくオブジェクト検出のための効率的な不確実性推定
- Authors: Yutong Yang, Katarina Popović, Julian Wiederer, Markus Braun, Vasileios Belagiannis, Bin Yang,
- Abstract要約: GroupEnsembleはDTRのようなモデルに対する効率的かつ効果的な不確実性推定手法である。
我々は,都市景観とCOCOデータセットを用いて,自律運転シーンと日常の日常シーン下での手法の有効性を検証した。
その結果,MC-Dropout と GroupEnsemble を組み合わせたハイブリッドアプローチは,Deep Ensembles をコストのごく一部で実現していることがわかった。
- 参考スコア(独自算出の注目度): 10.241307426902178
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Detection Transformer (DETR) and its variants show strong performance on object detection, a key task for autonomous systems. However, a critical limitation of these models is that their confidence scores only reflect semantic uncertainty, failing to capture the equally important spatial uncertainty. This results in an incomplete assessment of the detection reliability. On the other hand, Deep Ensembles can tackle this by providing high-quality spatial uncertainty estimates. However, their immense memory consumption makes them impractical for real-world applications. A cheaper alternative, Monte Carlo (MC) Dropout, suffers from high latency due to the need of multiple forward passes during inference to estimate uncertainty. To address these limitations, we introduce GroupEnsemble, an efficient and effective uncertainty estimation method for DETR-like models. GroupEnsemble simultaneously predicts multiple individual detection sets by feeding additional diverse groups of object queries to the transformer decoder during inference. Each query group is transformed by the shared decoder in isolation and predicts a complete detection set for the same input. An attention mask is applied to the decoder to prevent inter-group query interactions, ensuring each group detects independently to achieve reliable ensemble-based uncertainty estimation. By leveraging the decoder's inherent parallelism, GroupEnsemble efficiently estimates uncertainty in a single forward pass without sequential repetition. We validated our method under autonomous driving scenes and common daily scenes using the Cityscapes and COCO datasets, respectively. The results show that a hybrid approach combining MC-Dropout and GroupEnsemble outperforms Deep Ensembles on several metrics at a fraction of the cost. The code is available at https://github.com/yutongy98/GroupEnsemble.
- Abstract(参考訳): 検出変換器(DETR)とその変種は、自律システムにとって重要なタスクであるオブジェクト検出に強い性能を示す。
しかし、これらのモデルにおいて重要な制限は、その信頼性スコアが意味的不確実性のみを反映し、同様に重要な空間不確実性を捉えることができないことである。
これにより、検出信頼性が不完全な評価となる。
一方、Deep Ensemblesは高品質な空間不確実性推定を提供することでこの問題に対処することができる。
しかし、その膨大なメモリ消費は、現実世界のアプリケーションには実用的ではない。
より安価な代替案であるMonte Carlo (MC) Dropoutは、不確実性を見積もるために、推論中に複数のフォワードパスが必要になるため、高いレイテンシに悩まされる。
これらの制約に対処するために,DTRのようなモデルに対する効率的かつ効果的な不確実性推定手法であるGroupEnsembleを導入する。
GroupEnsembleは、推論中にトランスフォーマーデコーダに追加の多様なオブジェクトクエリ群を供給することによって、複数の個別検出セットを同時に予測する。
各クエリグループは、共有デコーダによって独立して変換され、同じ入力に対する完全な検出セットを予測する。
デコーダにアテンションマスクを適用して、グループ間のクエリ相互作用を防止し、各グループが独立して検出し、信頼できるアンサンブルベースの不確実性推定を実現する。
デコーダ固有の並列性を利用することで、GroupEnsembleはシーケンシャルな繰り返しなしに単一の前方通過における不確実性を効率的に推定する。
筆者らは,都市景観とCOCOデータセットを用いて,自律運転シーンと日常の日常シーンで手法を検証した。
その結果,MC-Dropout と GroupEnsemble を組み合わせたハイブリッドアプローチは,Deep Ensembles をコストのごく一部で実現していることがわかった。
コードはhttps://github.com/yutongy98/GroupEnsemble.comから入手できる。
関連論文リスト
- SetAD: Semi-Supervised Anomaly Learning in Contextual Sets [25.628827917857603]
半教師付き異常検出は、限られたラベル付きデータを効果的に活用することで大きな可能性を秘めている。
本研究では,半教師付きADをSet-level Anomaly Detectionタスクとして再編成する新しいフレームワークであるSetADを提案する。
頑健性とスコアの校正性を高めるため,文脈校正型異常スコアリング機構を提案する。
論文 参考訳(メタデータ) (2025-11-26T13:27:59Z) - FIVA: Federated Inverse Variance Averaging for Universal CT Segmentation with Uncertainty Estimation [4.544160712377809]
本研究は,多様な腹部CTデータセットにまたがる普遍的なセグメンテーションを実現するための,新しいフェデレーション学習手法を提案する。
提案手法はモデル重みから不確かさを伝搬することにより予測の不確かさを定量化する。
実験により, フェデレーションアグリゲーションと不確実性重み付け推論の品質向上に本手法の有効性が示された。
論文 参考訳(メタデータ) (2025-08-08T11:34:01Z) - An Uncertainty-aware DETR Enhancement Framework for Object Detection [10.102900613370817]
本稿では,DETRを用いた物体検出のための不確実性認識フレームワークを提案する。
我々はハイリスク情報をフィルタリングし、検出信頼性を向上させるベイズリスクの定式化を導出する。
COCOベンチマーク実験により,本手法を既存のDECR変種に効果的に統合できることが示唆された。
論文 参考訳(メタデータ) (2025-07-20T07:53:04Z) - Uncertainty-Aware Prototype Semantic Decoupling for Text-Based Person Search in Full Images [16.071286104558393]
テキストに基づく歩行者探索 (TBPS) は, 対象歩行者の位置を自然言語で特定することを目的としている。
MUE(Multi-granularity Uncertainity Estimation)、PUD(Prototype-based Uncertainity Decoupling)、ReID(Cross-modal Re-identification)の3つのモジュールからなる新しいフレームワークであるUDD-TBPSを提案する。
論文 参考訳(メタデータ) (2025-05-06T14:25:30Z) - LoRA-Ensemble: Efficient Uncertainty Modelling for Self-Attention Networks [52.46420522934253]
本稿では,自己注意ネットワークのためのパラメータ効率のよいアンサンブル手法であるLoRA-Ensembleを紹介する。
この方法は、BatchEnsembleのような最先端の暗黙のテクニックを上回るだけでなく、Explicit Ensembleの正確さにマッチするか超える。
論文 参考訳(メタデータ) (2024-05-23T11:10:32Z) - Noisy Correspondence Learning with Self-Reinforcing Errors Mitigation [63.180725016463974]
クロスモーダル検索は、実際は精力的な、十分に整合した大規模データセットに依存している。
我々は、新しい雑音対応学習フレームワーク、textbfSelf-textbfReinforcing textbfErrors textbfMitigation(SREM)を導入する。
論文 参考訳(メタデータ) (2023-12-27T09:03:43Z) - Uncertainty-aware Unsupervised Multi-Object Tracking [33.53331700312752]
教師なしマルチオブジェクトトラッカーは、信頼できる機能埋め込みの学習に劣る。
最近の自己監督技術は採用されているが、時間的関係を捉えられなかった。
本稿では、不確実性問題は避けられないが、不確実性自体を活用して学習された一貫性を向上させることができると論じる。
論文 参考訳(メタデータ) (2023-07-28T09:03:06Z) - Semi-DETR: Semi-Supervised Object Detection with Detection Transformers [105.45018934087076]
半教師付き物体検出(SSOD)におけるDETRに基づくフレームワークの解析
本報告では,第1次変圧器を用いたエンド・ツー・エンド半教師対象検出器であるSemi-DETRについて述べる。
我々の手法は、最先端の手法をクリアマージンで上回る。
論文 参考訳(メタデータ) (2023-07-16T16:32:14Z) - Uncertainty Quantification of Collaborative Detection for Self-Driving [12.590332512097698]
連結車両と自律車両(CAV)間の情報共有は、自動運転のための協調物体検出の性能を向上させる。
しかし、CAVは実用上の課題のため、まだ物体検出に不確実性を持っている。
我々の研究は、協調物体検出の不確かさを最初に見積もるものである。
論文 参考訳(メタデータ) (2022-09-16T20:30:45Z) - CertainNet: Sampling-free Uncertainty Estimation for Object Detection [65.28989536741658]
ニューラルネットワークの不確実性を推定することは、安全クリティカルな設定において基本的な役割を果たす。
本研究では,オブジェクト検出のための新しいサンプリング不要不確実性推定法を提案する。
私たちはそれをCertainNetと呼び、各出力信号に対して、オブジェクト性、クラス、位置、サイズという、別の不確実性を提供するのは、これが初めてです。
論文 参考訳(メタデータ) (2021-10-04T17:59:31Z) - Probabilistic Ranking-Aware Ensembles for Enhanced Object Detections [50.096540945099704]
本稿では,検知器から箱を囲むことの信頼性を向上するPRAE(Probabilistic Ranking Aware Ensemble)という新しいアンサンブルを提案する。
また,異なる数の箱を扱う必要性によって生じる信頼の不均衡問題に対処するためのbanditアプローチも導入する。
論文 参考訳(メタデータ) (2021-05-07T09:37:06Z) - Scope Head for Accurate Localization in Object Detection [135.9979405835606]
本研究では,各位置のアンカーを相互依存関係としてモデル化したScopeNetと呼ばれる新しい検出器を提案する。
我々の簡潔で効果的な設計により、提案したScopeNetはCOCOの最先端の成果を達成する。
論文 参考訳(メタデータ) (2020-05-11T04:00:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。