論文の概要: Towards Robust Cross-Dataset Object Detection Generalization under Domain Specificity
- arxiv url: http://arxiv.org/abs/2601.09497v1
- Date: Wed, 14 Jan 2026 14:03:11 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-15 18:59:20.420466
- Title: Towards Robust Cross-Dataset Object Detection Generalization under Domain Specificity
- Title(参考訳): ドメイン固有性を考慮したロバストなクロスデータセットオブジェクト検出一般化に向けて
- Authors: Ritabrata Chakraborty, Hrishit Mitra, Shivakumara Palaiahnakote, Umapada Pal,
- Abstract要約: 本研究では, クロスデータセットオブジェクト検出(CD-OD)について, 設定特異性のレンズを用いて検討する。
ベンチマークを、さまざまな日常シーンと、狭い環境に関連付けられた設定固有のデータセットで、設定に依存しないデータセットにグループ化する。
同じ設定タイプ内での転送は比較的安定であり、設定タイプ間での転送は実質的に減少し、しばしば非対称である。
- 参考スコア(独自算出の注目度): 13.5313300700141
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Object detectors often perform well in-distribution, yet degrade sharply on a different benchmark. We study cross-dataset object detection (CD-OD) through a lens of setting specificity. We group benchmarks into setting-agnostic datasets with diverse everyday scenes and setting-specific datasets tied to a narrow environment, and evaluate a standard detector family across all train--test pairs. This reveals a clear structure in CD-OD: transfer within the same setting type is relatively stable, while transfer across setting types drops substantially and is often asymmetric. The most severe breakdowns occur when transferring from specific sources to agnostic targets, and persist after open-label alignment, indicating that domain shift dominates in the hardest regimes. To disentangle domain shift from label mismatch, we compare closed-label transfer with an open-label protocol that maps predicted classes to the nearest target label using CLIP similarity. Open-label evaluation yields consistent but bounded gains, and many corrected cases correspond to semantic near-misses supported by the image evidence. Overall, we provide a principled characterization of CD-OD under setting specificity and practical guidance for evaluating detectors under distribution shift. Code will be released at \href{[https://github.com/Ritabrata04/cdod-icpr.git}{https://github.com/Ritabrata04/cdod-icpr}.
- Abstract(参考訳): オブジェクト検出器はよく分布においてよく機能するが、異なるベンチマークで鋭く劣化する。
本研究では, クロスデータセットオブジェクト検出(CD-OD)について, 設定特異性のレンズを用いて検討する。
ベンチマークを、さまざまな日常シーンと狭い環境に関連付けられた設定固有のデータセットを備えた設定非依存データセットに分類し、すべての列車-テストペアで標準検出ファミリを評価する。
同じ設定タイプ内での転送は比較的安定であり、設定タイプ間での転送は実質的に減少し、しばしば非対称である。
最も深刻な破壊は、特定のソースから非依存的なターゲットへ移動し、オープンラベルアライメント後に持続するときに起こり、最も困難な状態においてドメインシフトが支配的であることを示す。
ラベルミスマッチからドメインシフトを遠ざけるために、CLIP類似性を用いて予測されたクラスを最も近いターゲットラベルにマッピングするオープンラベルプロトコルとクローズドラベル転送を比較した。
オープンラベル評価は、一貫性はあるが有界なゲインをもたらし、多くの補正されたケースは、画像証拠によって支持されるセマンティックニアミスに対応する。
全体として,CD-ODの特異性の設定による特徴付けと,分布シフトによる検出器評価の実践的ガイダンスを提供する。
コードは \href{[https://github.com/Ritabrata04/cdod-icpr.git}{https://github.com/Ritabrata04/cdod-icpr} でリリースされる。
関連論文リスト
- DiffRegCD: Integrated Registration and Change Detection with Diffusion Features [74.3102451211493]
DiffRegCDは、単一のモデルで密度の高い登録と変更検出を統一する統合フレームワークである。
空中(LEVIR-CD, DSIFN-CD, WHU-CD, SYSU-CD)と地上(VL-CMU-CD)のデータセットによる実験は、DiffRegCDが最近のベースラインを一貫して上回っていることを示している。
論文 参考訳(メタデータ) (2025-11-11T07:32:19Z) - Bridge Feature Matching and Cross-Modal Alignment with Mutual-filtering for Zero-shot Anomaly Detection [25.349261412750586]
本研究では,ZSAD 用 textbfFiSeCLIP とトレーニング不要 textbfCLIP を導入し,特徴マッチングとクロスモーダルアライメントを組み合わせた。
本手法は,異常検出ベンチマークにおいて,異常分類とセグメンテーションの両方において優れた性能を示す。
論文 参考訳(メタデータ) (2025-07-15T05:42:17Z) - Contrastive Conditional Alignment based on Label Shift Calibration for Imbalanced Domain Adaptation [16.944918133828722]
教師なしドメイン適応(UDA)のためのラベルシフトキャリブレーション(CCA-LSC)に基づくコントラスト条件アライメントを提案する。
本手法は,ラベルシフトと共変量シフトを併用したベンチマークにおいて,既存のUDA法およびIDA法より優れる。
論文 参考訳(メタデータ) (2024-12-29T03:34:31Z) - Multi-clue Consistency Learning to Bridge Gaps Between General and Oriented Object in Semi-supervised Detection [26.486535389258965]
半教師あり学習における汎用物体検出とオブジェクト指向物体検出の3つのギャップを実験的に発見する。
本稿では,これらのギャップを埋めるために,MCL(Multi-clue Consistency Learning)フレームワークを提案する。
提案したMCLは,半教師付きオブジェクト指向物体検出タスクにおいて最先端の性能を実現することができる。
論文 参考訳(メタデータ) (2024-07-08T13:14:25Z) - DATR: Unsupervised Domain Adaptive Detection Transformer with Dataset-Level Adaptation and Prototypical Alignment [7.768332621617199]
我々は、オブジェクト検出の教師なし領域適応のために、ドメイン適応検出TRansformer(DATR)と呼ばれる強力なDETRベースの検出器を導入する。
提案するDATRは,教師モデルによって生成された擬似ラベルを用いて,平均教師に基づく自己学習フレームワークを組み込んで,ドメインバイアスをさらに緩和する。
複数のドメイン適応シナリオにおいて,提案したDATRの性能と一般化性を示す実験を行った。
論文 参考訳(メタデータ) (2024-05-20T03:48:45Z) - Divide and Contrast: Source-free Domain Adaptation via Adaptive
Contrastive Learning [122.62311703151215]
Divide and Contrast (DaC) は、それぞれの制限を回避しつつ、両方の世界の善良な端を接続することを目的としている。
DaCは、ターゲットデータをソースライクなサンプルとターゲット固有なサンプルに分割する。
さらに、ソースライクなドメインと、メモリバンクベースの最大平均離散性(MMD)損失を用いて、ターゲット固有のサンプルとを整合させて、分散ミスマッチを低減する。
論文 参考訳(メタデータ) (2022-11-12T09:21:49Z) - Seeking Similarities over Differences: Similarity-based Domain Alignment
for Adaptive Object Detection [86.98573522894961]
本研究では,Unsupervised Domain Adaptation (UDA) アルゴリズムが検出に使用するコンポーネントを一般化するフレームワークを提案する。
具体的には、最適な設計選択を生かした新しいUDAアルゴリズムViSGAを提案し、インスタンスレベルの特徴を集約する単純だが効果的な方法を提案する。
類似性に基づくグループ化と対角トレーニングの両方により、モデルでは、ゆるやかに整列されたドメインにまたがるすべてのインスタンスにマッチせざるを得ず、機能グループを粗い整列することに集中することが可能であることが示されています。
論文 参考訳(メタデータ) (2021-10-04T13:09:56Z) - Conditional Extreme Value Theory for Open Set Video Domain Adaptation [17.474956295874797]
本稿では,ソースとターゲットデータ間の領域差を軽減するために,オープンセットの映像領域適応手法を提案する。
負の伝達問題を緩和するために、サンプルエントロピーからしきい値までの距離によって計算された重みを、対向学習に活用する。
提案手法は,小規模と大規模の両方のクロスドメインビデオデータセットに対して徹底的に評価されている。
論文 参考訳(メタデータ) (2021-09-01T10:51:50Z) - Instance Level Affinity-Based Transfer for Unsupervised Domain
Adaptation [74.71931918541748]
ILA-DAと呼ばれる適応中のソースからターゲットへの転送に対するインスタンス親和性に基づく基準を提案する。
まず、ソースとターゲットをまたいだ類似および異種サンプルを抽出し、マルチサンプルのコントラスト損失を利用してドメインアライメントプロセスを駆動する信頼性が高く効率的な手法を提案する。
ILA-DAの有効性は、様々なベンチマークデータセットに対する一般的なドメイン適応手法よりも精度が一貫した改善を観察することによって検証する。
論文 参考訳(メタデータ) (2021-04-03T01:33:14Z) - Coping with Label Shift via Distributionally Robust Optimisation [72.80971421083937]
分散ロバスト最適化(DRO)に基づく目的最小化モデルを提案する。
そこで我々は,提案した目的を最適化するために,大規模問題に適した勾配降下近位ミラー上昇アルゴリズムを設計し,解析する。
論文 参考訳(メタデータ) (2020-10-23T08:33:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。