論文の概要: RT-SDGOD: Real-Time Single-Domain Generalized Object Detection
- arxiv url: http://arxiv.org/abs/2606.09367v1
- Date: Mon, 08 Jun 2026 11:39:18 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-09 14:42:06.94846
- Title: RT-SDGOD: Real-Time Single-Domain Generalized Object Detection
- Title(参考訳): RT-SDGOD:リアルタイム単一ドメイン汎用オブジェクト検出
- Authors: Yupeng Zhang, Fangzhuo Gao, Ruize Han, Wei Feng, Liang Wan,
- Abstract要約: リアルタイムの制約の下では、気象や画像の変動は大きな分布シフトを引き起こし、検出器を著しく劣化させる。
RT-SDGOD(Real-Time Single-Domain Generalized Object Detection)を導入する。
提案手法は,複数の未確認対象領域にまたがる既存手法よりも優れた一般化性能を実現する。
- 参考スコア(独自算出の注目度): 29.73970506841414
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In real-world deployment under strict real-time constraints, weather and imaging variations induce significant distribution shifts, severely degrading detectors. Single-Domain Generalized Object Detection aims to mitigate this issue, yet existing methods rarely investigate-at the level of problem formulation-the generalization capability of real-time detectors under such constrained inference budgets. To this end, we introduce Real-Time Single-Domain Generalized Object Detection (RT-SDGOD), which focuses on how real-time detectors can achieve cross-domain generalization under zero extra inference overhead by relying solely on training-time representation learning. We observe that, under domain shift, DETR-based real-time detectors mainly degrade through increased missed detections, rooted in limited and unstable object-level discriminative evidence. Based on this, we propose RT-SDGDet, a multi-evidence collaborative modeling framework for RT-SDGOD. The core idea is to enable multiple queries of the same object to collaboratively cover more sufficient discriminative evidence while maintaining the stability of such evidence modeling across views. Specifically, we use one-to-many (O2M) supervision to construct stable object-specific query groups, and further design Discriminative Evidence Diversity Learning (DEDL) and Dual-view Evidence Consistency Learning (DvECL) to expand object-level evidence coverage and improve evidence stability under appearance perturbations, respectively. Since all components are introduced only during training, our method incurs no extra inference overhead. Extensive experiments show that the proposed method achieves better generalization performance than existing approaches across multiple unseen target domains.
- Abstract(参考訳): 厳密なリアルタイム制約の下での現実世界の展開では、天気や画像の変動は大きな分布シフトを引き起こし、検出器を著しく劣化させる。
単一ドメイン一般化オブジェクト検出はこの問題を軽減することを目的としているが、既存の手法ではそのような制約付き推論予算の下でリアルタイム検出器の一般化能力について、問題定式化のレベルを調査することはめったにない。
この目的のために、実時間単一ドメイン一般化オブジェクト検出(RT-SDGOD)を導入し、学習時間表現学習のみに頼って、ゼロの余分な推論オーバーヘッドの下で、リアルタイム検出器がクロスドメインの一般化を実現する方法に焦点を当てた。
ドメインシフトの下では、DETRベースのリアルタイム検出器は、主に、限定的で不安定な物体レベルの識別証拠に根ざした、欠落検出の増大によって劣化する。
そこで本研究では,RT-SDGODのためのマルチエビデンス協調モデリングフレームワークRT-SDGDetを提案する。
中心となる考え方は、同じオブジェクトの複数のクエリが、ビューをまたいだこのようなエビデンスモデリングの安定性を維持しながら、より十分な識別的エビデンスを協調的にカバーできるようにすることである。
具体的には、安定なオブジェクト固有のクエリグループを構築するために、一対多の監視(O2M)を使用し、さらに、識別的エビデンス多様性学習(DEDL)とデュアルビューエビデンス一貫性学習(DvECL)を用いて、オブジェクトレベルのエビデンスカバレッジを拡大し、外観摂動下でのエビデンス安定性を向上させる。
すべてのコンポーネントはトレーニング中にのみ導入されるので、私たちのメソッドは追加の推論オーバーヘッドを発生させません。
大規模な実験により,提案手法は既存の複数の未確認対象領域にまたがる手法よりも優れた一般化性能が得られることが示された。
関連論文リスト
- VFM$^{4}$SDG: Unveiling the Power of VFMs for Single-Domain Generalized Object Detection [33.39250067795076]
現実のシナリオでは、天気、照明、撮像条件の連続的な変化は、大きなドメインシフトを引き起こす。
一般化オブジェクト検出(SDGOD)のための二元学習フレームワークを提案する。
符号化段階では,オブジェクト・バックグラウンドとインスタンス間モデリングの堅牢性を高めるために,クロスドメイン安定優先蒸留を提案する。
復号段階では,セマンティック・コンテキスト優先型クエリ拡張を提案する。
論文 参考訳(メタデータ) (2026-04-23T10:04:36Z) - Rethinking Representations for Cross-Domain Infrared Small Target Detection: A Generalizable Perspective from the Frequency Domain [26.03122882760887]
クロスドメインIRSTDのための空間-スペクトル協調認識ネットワークを提案する。
我々は、一般化可能な目標認識を導出するための位相修正モジュール(PRM)を開発した。
我々は、位置情報を保持するために、スキップ接続に注意機構(OAM)を用いる。
論文 参考訳(メタデータ) (2026-04-02T11:54:28Z) - Integrating Diverse Assignment Strategies into DETRs [61.61489761918158]
ラベル割り当ては、特にDETRスタイルのフレームワークにおいて、オブジェクト検出器において重要なコンポーネントである。
我々は,任意のDETR型検出器に多様な割り当て戦略をシームレスに統合する,フレキシブルで軽量なフレームワークであるLoRA-DETRを提案する。
論文 参考訳(メタデータ) (2026-01-14T07:28:54Z) - RAAR: Retrieval Augmented Agentic Reasoning for Cross-Domain Misinformation Detection [31.765619582229146]
RAARは、クロスドメイン誤情報検出のための検索強化エージェント推論フレームワークである。
RAARは、それぞれのサンプルのセマンティクス、感情、書き込みスタイルに沿ったソースドメインのエビデンスを取得する。
RAARは、特殊なマルチエージェントコラボレーションを通じて、検証可能な多段階推論パスを構築する。
論文 参考訳(メタデータ) (2026-01-08T11:43:16Z) - DuET: Dual Incremental Object Detection via Exemplar-Free Task Arithmetic [12.91797400491484]
自律走行や監視のような現実世界の物体検出システムは、新しい対象カテゴリーを継続的に学習する必要がある。
既存のアプローチでは、クラスインクリメンタルオブジェクト検出(CIOD)とドメインインクリメンタルオブジェクト検出(DIOD)がこの課題の1つの側面にのみ対応している。
DuIOD(Dual Incremental Object Detection)は,クラスとドメインのシフトを同時に処理する,より実用的な設定法である。
論文 参考訳(メタデータ) (2025-06-26T13:41:47Z) - Cross-Domain Few-Shot Object Detection via Enhanced Open-Set Object Detector [72.05791402494727]
本稿では,CD-FSODを用いたクロスドメイン小ショット検出法について検討する。
最小限のラベル付き例で、新しいドメインのための正確なオブジェクト検出器を開発することを目的としている。
論文 参考訳(メタデータ) (2024-02-05T15:25:32Z) - Towards Domain Generalization in Object Detection [32.68332102237882]
本研究では,物体検出(DGOD)における領域一般化という重要な問題について検討し,検出器をソースドメインで訓練し,未知のターゲットドメインで評価する。
本稿では,RoI特徴量への依存を解消するため,RAPT(Rerea Aware Proposal reweighTing)という新しい手法を提案する。
論文 参考訳(メタデータ) (2022-03-27T20:35:37Z) - Decompose to Adapt: Cross-domain Object Detection via Feature
Disentanglement [79.2994130944482]
本研究では,DDF(Domain Disentanglement Faster-RCNN)を設計し,タスク学習のための特徴のソース固有情報を排除した。
DDF法は,グローバルトリプルト・ディアンタングルメント(GTD)モジュールとインスタンス類似性・ディアンタングルメント(ISD)モジュールを用いて,グローバルおよびローカルステージでの機能ディアンタングルを容易にする。
提案手法は,4つのUDAオブジェクト検出タスクにおいて最先端の手法より優れており,広い適用性で有効であることが実証された。
論文 参考訳(メタデータ) (2022-01-06T05:43:01Z) - Unsupervised Domain Adaptive 3D Detection with Multi-Level Consistency [90.71745178767203]
ディープラーニングに基づく3Dオブジェクト検出は、大規模な自律走行データセットの出現によって、前例のない成功を収めた。
既存の3Dドメイン適応検出手法は、しばしばターゲットのドメインアノテーションへの事前アクセスを前提とします。
我々は、ソースドメインアノテーションのみを利用する、より現実的な、教師なしの3Dドメイン適応検出について研究する。
論文 参考訳(メタデータ) (2021-07-23T17:19:23Z) - Robust Object Detection via Instance-Level Temporal Cycle Confusion [89.1027433760578]
物体検出器の分布外一般化を改善するための補助的自己監視タスクの有効性を検討する。
最大エントロピーの原理に触発されて,新しい自己監督タスクであるインスタンスレベル時間サイクル混乱(cycconf)を導入する。
それぞれのオブジェクトに対して、タスクは、ビデオ内の隣接するフレームで最も異なるオブジェクトの提案を見つけ、自己スーパービジョンのために自分自身にサイクルバックすることです。
論文 参考訳(メタデータ) (2021-04-16T21:35:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。