論文の概要: HMR-Net: Hierarchical Modular Routing for Cross-Domain Object Detection in Aerial Images
- arxiv url: http://arxiv.org/abs/2604.18866v1
- Date: Mon, 20 Apr 2026 21:41:23 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-22 22:41:49.510947
- Title: HMR-Net: Hierarchical Modular Routing for Cross-Domain Object Detection in Aerial Images
- Title(参考訳): HMR-Net:空中画像におけるクロスドメイン物体検出のための階層的モジュラールーティング
- Authors: Pourya Shamsolmoali, Masoumeh Zareapoor, Michael Felsberg, Nick Pears, Yue Lu,
- Abstract要約: 本研究では,空中検出における構造化特化を実現するための新しいモジュール型学習フレームワークを提案する。
本手法は,データセットや複雑なシーンにまたがって特化している。
モノリシックな表現を超えて、リモートセンシングオブジェクト検出のための適応的なフレームワークを提供する。
- 参考スコア(独自算出の注目度): 41.44626697980156
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Despite advances in object detection, aerial imagery remains a challenging domain, as models often fail to generalize across variations in spatial resolution, scene composition, and semantic label coverage. Differences in geographic context, sensor characteristics, and object distributions across datasets limit the capacity of conventional models to learn consistent and transferable representations. Shared methods trained on such data tend to impose a unified representation across fundamentally different domains, resulting in poor performance on region-specific content and less flexibility when dealing with novel object categories. To address this, we propose a novel modular learning framework that enables structured specialization in aerial detection. Our method introduces a hierarchical routing mechanism with two levels of modularity: a global expert assignment layer that uses latent geographic embeddings to route datasets to specialized processing modules, and a local scene decomposition mechanism that allocates image subregions to region-specific sub-modules. This allows our method to specialize across datasets and within complex scenes. Additionally, the framework contains a conditional expert module that uses external semantic information (e.g., category names or textual descriptions) to enable detection of novel object categories during inference, without the need for retraining or fine-tuning. By moving beyond monolithic representations, our method offers an adaptive framework for remote sensing object detection. Comprehensive evaluations on four datasets highlight improvements in multi-dataset generalization, regional specialization, and open-category detection.
- Abstract(参考訳): オブジェクト検出の進歩にもかかわらず、空間分解能、シーン構成、セマンティックラベルのカバレッジの様々なバリエーションでモデルが一般化できないため、空中画像は依然として困難な領域である。
データセット間の地理的コンテキスト、センサ特性、オブジェクト分布の違いは、一貫性と伝達可能な表現を学ぶための従来のモデルの容量を制限する。
このようなデータに基づいてトレーニングされた共有メソッドは、基本的に異なるドメインに統一された表現を課す傾向があり、結果として、領域固有のコンテンツのパフォーマンスが低下し、新しいオブジェクトカテゴリを扱う際の柔軟性が低下する。
そこで本研究では,空中検出における構造化特化を実現するための新しいモジュール型学習フレームワークを提案する。
本手法では,階層的なルーティング機構を2段階に分けて導入する。グローバルな専門家割当てレイヤは,データセットを特殊な処理モジュールにルーティングする潜在地理的埋め込みと,領域固有のサブモジュールにイメージサブリージョンを割り当てる局所的なシーン分解機構である。
これにより、データセットや複雑なシーン内での専門化が可能になります。
さらに、フレームワークには、外部のセマンティック情報(カテゴリ名やテキスト記述など)を使用して、トレーニングや微調整を必要とせずに、推論中に新しいオブジェクトカテゴリの検出を可能にする条件付きエキスパートモジュールが含まれている。
モノリシックな表現を超えて、リモートセンシングオブジェクト検出のための適応的なフレームワークを提供する。
4つのデータセットの総合評価では、マルチデータセットの一般化、地域特化、オープンカテゴリ検出の改善が強調されている。
関連論文リスト
- SegDesicNet: Lightweight Semantic Segmentation in Remote Sensing with Geo-Coordinate Embeddings for Domain Adaptation [0.5461938536945723]
リモートセマンティックセマンティックセグメンテーションのための新しい教師なしドメイン適応手法を提案する。
提案するSegDesicNetモジュールは、単位球上に投影された座標のGRID位置符号化を遅らせ、ドメイン損失を得る。
我々のアルゴリズムは,人工ニューラルネットワークと物理世界の人間の理解とのモデリング格差を減らそうとしている。
論文 参考訳(メタデータ) (2025-03-11T11:01:18Z) - Generalize or Detect? Towards Robust Semantic Segmentation Under Multiple Distribution Shifts [56.57141696245328]
斬新なクラスとドメインの両方が存在するようなオープンワールドシナリオでは、理想的なセグメンテーションモデルは安全のために異常なクラスを検出する必要がある。
既存の方法はドメインレベルとセマンティックレベルの分散シフトを区別するのに苦労することが多い。
論文 参考訳(メタデータ) (2024-11-06T11:03:02Z) - Learning to Generalize Unseen Domains via Multi-Source Meta Learning for Text Classification [71.08024880298613]
テキスト分類の多元的領域一般化について検討する。
本稿では、複数の参照ドメインを使用して、未知のドメインで高い精度を達成可能なモデルをトレーニングするフレームワークを提案する。
論文 参考訳(メタデータ) (2024-09-20T07:46:21Z) - A$^{2}$-MAE: A spatial-temporal-spectral unified remote sensing pre-training method based on anchor-aware masked autoencoder [26.81539884309151]
リモートセンシング(RS)データは、重要な空間情報、時間情報、スペクトル情報を含む、複数の次元にわたる地球観測を提供する。
RSデータの特徴に合わせた様々な事前学習手法にもかかわらず、重要な制限は持続する: 空間、時間、スペクトル情報を単一の統一モデルに効果的に統合できないことである。
本研究では,異なる種類の画像と地理情報から固有の補完情報を活用し,事前学習期間中にマスク付きパッチを再構築するアンカー・アウェア・マスク付きオートエンコーダ手法(A$2-MAE)を提案する。
論文 参考訳(メタデータ) (2024-06-12T11:02:15Z) - AFAN: Augmented Feature Alignment Network for Cross-Domain Object
Detection [90.18752912204778]
オブジェクト検出のための教師なしドメイン適応は、多くの現実世界のアプリケーションにおいて難しい問題である。
本稿では、中間領域画像生成とドメイン・アドバイザリー・トレーニングを統合した新しい機能アライメント・ネットワーク(AFAN)を提案する。
提案手法は、類似および異種ドメイン適応の双方において、標準ベンチマークにおける最先端の手法よりも大幅に優れている。
論文 参考訳(メタデータ) (2021-06-10T05:01:20Z) - Hierarchical Context Embedding for Region-based Object Detection [40.9463003508027]
階層型コンテキスト埋め込み(HCE)フレームワークは、プラグイン・アンド・プレイコンポーネントとして適用することができる。
文脈依存型オブジェクトカテゴリの認識を促進するために,画像レベルのカテゴリ埋め込みモジュールを提案する。
画像全体と関心領域の両方に階層的に埋め込まれたコンテキスト情報を活用することで、新しいRoI機能を生成する。
論文 参考訳(メタデータ) (2020-08-04T05:33:22Z) - Spatial Attention Pyramid Network for Unsupervised Domain Adaptation [66.75008386980869]
教師なし領域適応は様々なコンピュータビジョンタスクにおいて重要である。
教師なし領域適応のための新しい空間注意ピラミッドネットワークを設計する。
我々の手法は最先端の手法に対して大きなマージンで好適に機能する。
論文 参考訳(メタデータ) (2020-03-29T09:03:23Z) - Universal-RCNN: Universal Object Detector via Transferable Graph R-CNN [117.80737222754306]
我々はUniversal-RCNNと呼ばれる新しいユニバーサルオブジェクト検出器を提案する。
まず、すべてのカテゴリの高レベルなセマンティック表現を統合することで、グローバルなセマンティックプールを生成する。
ドメイン内推論モジュールは、空間認識GCNによってガイドされる1つのデータセット内のスパースグラフ表現を学習し、伝播する。
論文 参考訳(メタデータ) (2020-02-18T07:57:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。