論文の概要: Bridging the Scale Gap: Balanced Tiny and General Object Detection in Remote Sensing Imagery
- arxiv url: http://arxiv.org/abs/2512.01665v1
- Date: Mon, 01 Dec 2025 13:36:09 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-02 19:46:34.869042
- Title: Bridging the Scale Gap: Balanced Tiny and General Object Detection in Remote Sensing Imagery
- Title(参考訳): スケールギャップのブリッジ:リモートセンシング画像におけるバランスの取れたTinyとジェネラルオブジェクト検出
- Authors: Zhicheng Zhao, Yin Huang, Lingma Sun, Chenglong Li, Jin Tang,
- Abstract要約: ScaleBridge-Detは、小さなオブジェクト用に設計された最初の大規模な検出フレームワークである。
スケール適応型エキスパートルーティングと密度誘導型クエリアロケーションによって、さまざまなスケールでバランスの取れたパフォーマンスを実現する。
本稿では,AI-TOD-V2およびDTOD上での最先端性能と,VisDrone上でのクロスドメインロバスト性を示す。
- 参考スコア(独自算出の注目度): 19.9904038521365
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Tiny object detection in remote sensing imagery has attracted significant research interest in recent years. Despite recent progress, achieving balanced detection performance across diverse object scales remains a formidable challenge, particularly in scenarios where dense tiny objects and large objects coexist. Although large foundation models have revolutionized general vision tasks, their application to tiny object detection remains unexplored due to the extreme scale variation and density distribution inherent to remote sensing imagery. To bridge this scale gap, we propose ScaleBridge-Det, to the best of our knowledge, the first large detection framework designed for tiny objects, which could achieve balanced performance across diverse scales through scale-adaptive expert routing and density-guided query allocation. Specifically, we introduce a Routing-Enhanced Mixture Attention (REM) module that dynamically selects and fuses scale-specific expert features via adaptive routing to address the tendency of standard MoE models to favor dominant scales. REM generates complementary and discriminative multi-scale representations suitable for both tiny and large objects. Furthermore, we present a Density-Guided Dynamic Query (DGQ) module that predicts object density to adaptively adjust query positions and numbers, enabling efficient resource allocation for objects of varying scales. The proposed framework allows ScaleBridge-Det to simultaneously optimize performance for both dense tiny and general objects without trade-offs. Extensive experiments on benchmark and cross-domain datasets demonstrate that ScaleBridge-Det achieves state-of-the-art performance on AI-TOD-V2 and DTOD, while exhibiting superior cross-domain robustness on VisDrone.
- Abstract(参考訳): リモートセンシング画像における細い物体検出は、近年、大きな研究関心を集めている。
最近の進歩にもかかわらず、様々なオブジェクトスケールでバランスの取れた検出性能を達成することは、特に高密度の小さなオブジェクトと大きなオブジェクトが共存するシナリオにおいて、非常に難しい課題である。
大きな基礎モデルは一般的な視覚タスクに革命をもたらしたが、リモートセンシング画像に固有の極端なスケールの変動と密度分布のために、微小物体検出への応用は未解明のままである。
このスケールギャップを埋めるため,我々は,スケール適応型エキスパートルーティングと密度誘導型クエリアロケーションを通じて,さまざまなスケールでバランスのとれたパフォーマンスを実現することができる,小型オブジェクト用に設計された最初の大規模検出フレームワークであるScaleBridge-Detを提案する。
具体的には,標準MoEモデルの傾向に対処するため,適応的ルーティングにより,動的にスケール固有の専門家機能を選択・融合するREMモジュールを提案する。
REMは、小さなオブジェクトと大きなオブジェクトの両方に適した相補的で差別的なマルチスケール表現を生成する。
さらに、オブジェクト密度を予測し、クエリ位置と数値を適応的に調整し、様々なスケールのオブジェクトに対して効率的なリソース割り当てを可能にするDGQ(Dercent-Guided Dynamic Query)モジュールを提案する。
提案したフレームワークにより、ScaleBridge-Detはトレードオフなしで、密集した小さなオブジェクトと一般的なオブジェクトの両方のパフォーマンスを同時に最適化できる。
ベンチマークとクロスドメインデータセットに関する大規模な実験は、ScaleBridge-DetがAI-TOD-V2とDTODの最先端のパフォーマンスを実現し、VisDroneに優れたクロスドメインロバスト性を示すことを示している。
関連論文リスト
- MGDFIS: Multi-scale Global-detail Feature Integration Strategy for Small Object Detection [12.838872442435527]
UAV画像の小さな物体検出は、探索・救助、交通監視、環境監視といった用途に不可欠である。
既存のマルチスケール融合法は、計算負荷を増し、詳細をぼかすのに役立つ。
本稿では,グローバルコンテキストと局所的な詳細を密結合して検出性能を向上させる統合融合フレームワークを提案する。
論文 参考訳(メタデータ) (2025-06-15T02:54:25Z) - Efficient Feature Fusion for UAV Object Detection [9.632727117779178]
特に小さな物体は画像のごく一部を占めており、正確な検出を困難にしている。
既存のマルチスケール機能融合手法は、様々な解像度で機能を集約することでこれらの課題に対処する。
本稿では,UAVオブジェクト検出タスクに特化して設計された新しい機能融合フレームワークを提案する。
論文 参考訳(メタデータ) (2025-01-29T20:39:16Z) - Generalization-Enhanced Few-Shot Object Detection in Remote Sensing [22.411751110592842]
Few-shot Object Detection (FSOD) は、データ制限条件下でのオブジェクト検出の課題をターゲットにしている。
リモートセンシングタスクにおける一般化機能を改善するために,GE-FSODモデルを提案する。
我々のモデルでは、CFPAN(Cross-Level Fusion Pyramid Attention Network)、MRRPN(Multi-Stage Refinement Region Proposal Network)、GCL(Generalized Classification Loss)の3つの重要なイノベーションを紹介している。
論文 参考訳(メタデータ) (2025-01-05T08:12:25Z) - SOOD++: Leveraging Unlabeled Data to Boost Oriented Object Detection [68.18620488664187]
本稿では,SOOD++ と呼ばれる簡易かつ効果的な半教師付きオブジェクト指向検出手法を提案する。
具体的には、空中画像からの物体は、通常任意の向き、小さなスケール、密度分布を持つ。
各種ラベル付き環境下での多目的対象物に対する大規模な実験により,本手法の有効性が示された。
論文 参考訳(メタデータ) (2024-07-01T07:03:51Z) - Innovative Horizons in Aerial Imagery: LSKNet Meets DiffusionDet for
Advanced Object Detection [55.2480439325792]
本稿では,LSKNetのバックボーンをDiffusionDetヘッドに統合したオブジェクト検出モデルの詳細な評価を行う。
提案手法は平均精度(MAP)を約45.7%向上させる。
この進歩は、提案された修正の有効性を強調し、航空画像解析の新しいベンチマークを設定する。
論文 参考訳(メタデータ) (2023-11-21T19:49:13Z) - Adaptive Rotated Convolution for Rotated Object Detection [96.94590550217718]
本稿では、回転物体検出問題に対処するために、適応回転変換(ARC)モジュールを提案する。
ARCモジュールでは、コンボリューションカーネルが適応的に回転し、異なる画像に異なる向きのオブジェクト特徴を抽出する。
提案手法は,81.77%mAPのDOTAデータセット上での最先端性能を実現する。
論文 参考訳(メタデータ) (2023-03-14T11:53:12Z) - AdaZoom: Adaptive Zoom Network for Multi-Scale Object Detection in Large
Scenes [57.969186815591186]
大規模なシーンの検出は、小さなオブジェクトと極端なスケールの変動のために難しい問題である。
本稿では,物体検出のための焦点領域を適応的に拡大するために,フレキシブルな形状と焦点長を有する選択的拡大器として,新しい適応型Zoom(AdaZoom)ネットワークを提案する。
論文 参考訳(メタデータ) (2021-06-19T03:30:22Z) - Salient Objects in Clutter [130.63976772770368]
本稿では,既存の正当性オブジェクト検出(SOD)データセットの重大な設計バイアスを特定し,対処する。
この設計バイアスは、既存のデータセットで評価した場合、最先端のSODモデルのパフォーマンスの飽和につながった。
我々は,新しい高品質データセットを提案し,前回のsaliencyベンチマークを更新する。
論文 参考訳(メタデータ) (2021-05-07T03:49:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。