論文の概要: Balanced Hierarchical Contrastive Learning with Decoupled Queries for Fine-grained Object Detection in Remote Sensing Images
- arxiv url: http://arxiv.org/abs/2512.24074v1
- Date: Tue, 30 Dec 2025 08:35:54 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-01 23:27:28.327222
- Title: Balanced Hierarchical Contrastive Learning with Decoupled Queries for Fine-grained Object Detection in Remote Sensing Images
- Title(参考訳): 遠隔センシング画像における細粒度物体検出のための疎結合クエリを用いたバランス付き階層的コントラスト学習
- Authors: Jingzhou Chen, Dexin Chen, Fengchao Xiong, Yuntao Qian, Liang Xiao,
- Abstract要約: 本稿では,検出変換器(DETR)フレームワーク内の非結合学習戦略と相まって,バランスの取れた階層的コントラスト損失を提案する。
提案した損失は、学習可能なクラスプロトタイプを導入し、各階層レベルで異なるクラスが貢献する勾配を均衡させる。
階層アノテーションを用いた3つのきめ細かいデータセットの実験により、我々の手法が最先端のアプローチより優れていることが示された。
- 参考スコア(独自算出の注目度): 14.170021143579435
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Fine-grained remote sensing datasets often use hierarchical label structures to differentiate objects in a coarse-to-fine manner, with each object annotated across multiple levels. However, embedding this semantic hierarchy into the representation learning space to improve fine-grained detection performance remains challenging. Previous studies have applied supervised contrastive learning at different hierarchical levels to group objects under the same parent class while distinguishing sibling subcategories. Nevertheless, they overlook two critical issues: (1) imbalanced data distribution across the label hierarchy causes high-frequency classes to dominate the learning process, and (2) learning semantic relationships among categories interferes with class-agnostic localization. To address these issues, we propose a balanced hierarchical contrastive loss combined with a decoupled learning strategy within the detection transformer (DETR) framework. The proposed loss introduces learnable class prototypes and equilibrates gradients contributed by different classes at each hierarchical level, ensuring that each hierarchical class contributes equally to the loss computation in every mini-batch. The decoupled strategy separates DETR's object queries into classification and localization sets, enabling task-specific feature extraction and optimization. Experiments on three fine-grained datasets with hierarchical annotations demonstrate that our method outperforms state-of-the-art approaches.
- Abstract(参考訳): 微細なリモートセンシングデータセットは、階層的なラベル構造を使って、オブジェクトを粗い方法で区別し、各オブジェクトを複数のレベルにわたって注釈付けする。
しかし, このセマンティック階層を表現学習空間に組み込んで, きめ細かい検出性能を向上させることは依然として困難である。
これまでの研究では、異なる階層レベルの教師付きコントラスト学習を、兄弟関係のサブカテゴリを区別しながら、同じ親クラス下のグループオブジェクトに適用してきた。
しかし,(1)ラベル階層間の不均衡なデータ分布は,高頻度クラスが学習プロセスを支配し,(2)カテゴリ間の意味的関係がクラス非依存の局所化に干渉する,という2つの重要な問題を見落としている。
これらの問題に対処するため、我々は、DETRフレームワーク内の非結合学習戦略と相まって、バランスの取れた階層的コントラスト損失を提案する。
提案した損失は学習可能なクラスプロトタイプを導入し、各階層レベルで異なるクラスが寄与する勾配を平衡させ、各階層クラスが各ミニバッチにおける損失計算に等しく寄与することを保証する。
分離された戦略は、DETRのオブジェクトクエリを分類とローカライゼーションセットに分離し、タスク固有の特徴抽出と最適化を可能にする。
階層アノテーションを用いた3つのきめ細かいデータセットの実験により、我々の手法が最先端のアプローチより優れていることが示された。
関連論文リスト
- A Semantics-Aware Hierarchical Self-Supervised Approach to Classification of Remote Sensing Images [12.282079123411947]
本稿では,階層的特徴と関係を学習するためのセマンティックス・アウェア・ヒエラルキー・コンセンサス(SAHC)手法を提案する。
SAHC法は、階層的な複雑さの異なる3つのベンチマークデータセットで評価される。
実験により,ネットワーク学習の指導における提案手法の有効性と,リモートセンシング画像分類タスクにおける階層的コンセンサスの有効性が示された。
論文 参考訳(メタデータ) (2025-10-06T15:30:39Z) - Feature Identification for Hierarchical Contrastive Learning [7.655211354400059]
本稿では,2つの新しい階層型コントラスト学習法を提案する。
提案手法は,階層レベルのクラス間関係と不均衡なクラス分布を明示的にモデル化する。
提案手法は,線形評価における最先端性能を実現し,既存の階層的コントラスト学習法を精度で2ポイント向上させる。
論文 参考訳(メタデータ) (2025-10-01T12:46:47Z) - Learning and Evaluating Hierarchical Feature Representations [3.770103075126785]
我々は、直交部分空間の階層的構成(Hier-COS)という新しい枠組みを提案する。
Hier-COSは、与えられた分類木の構造と整合した設計により、深い特徴埋め込みをベクトル空間にマッピングすることを学ぶ。
Hier-COSはすべてのデータセットにまたがって最先端の階層的パフォーマンスを実現し,同時に1つのケースを除いてトップ1の精度を上回ります。
論文 参考訳(メタデータ) (2025-03-10T20:59:41Z) - Hybrid Losses for Hierarchical Embedding Learning [4.2525210928495625]
マルチタスク学習フレームワークにおいて,一般化三重項やクロスエントロピー損失などのハイブリッド損失について検討する。
従来の分類, 検索, 組込み空間構造, 一般化において, 提案されたハイブリッド損失は, 従来よりも優れていたことが実証された。
論文 参考訳(メタデータ) (2025-01-22T10:58:04Z) - Bidirectional Logits Tree: Pursuing Granularity Reconcilement in Fine-Grained Classification [89.20477310885731]
本稿では,粒度分類タスクにおけるグラニュラリティコンペティションの課題について述べる。
既存のアプローチは通常、共通のベースエンコーダから抽出された共有特徴に基づいて、独立した階層認識モデルを開発する。
グラニュラリティ再構成のための双方向ロジットツリー(BiLT)と呼ばれる新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2024-12-17T10:42:19Z) - Harnessing Superclasses for Learning from Hierarchical Databases [1.835004446596942]
多くの大規模分類問題において、クラスは既知の階層に整理され、通常木として表される。
この種の教師付き階層分類の損失について紹介する。
提案手法では,クロスエントロピーの損失に比較して,計算コストの大幅な増大は伴わない。
論文 参考訳(メタデータ) (2024-11-25T14:39:52Z) - Weakly-supervised Action Localization via Hierarchical Mining [76.00021423700497]
弱教師付きアクションローカライゼーションは、ビデオレベルの分類ラベルだけで、与えられたビデオ内のアクションインスタンスを時間的にローカライズし、分類することを目的としている。
ビデオレベルおよびスニペットレベルでの階層的マイニング戦略,すなわち階層的監視と階層的一貫性マイニングを提案する。
我々は、HiM-NetがTHUMOS14とActivityNet1.3データセットの既存の手法よりも、階層的に監督と一貫性をマイニングすることで、大きなマージンを持つことを示す。
論文 参考訳(メタデータ) (2022-06-22T12:19:09Z) - Use All The Labels: A Hierarchical Multi-Label Contrastive Learning
Framework [75.79736930414715]
本稿では,すべての利用可能なラベルを活用でき,クラス間の階層的関係を維持できる階層型多言語表現学習フレームワークを提案する。
比較損失に階層的ペナルティを併用し,その階層的制約を強制する。
論文 参考訳(メタデータ) (2022-04-27T21:41:44Z) - The Overlooked Classifier in Human-Object Interaction Recognition [82.20671129356037]
クラス間の意味的相関を分類ヘッドにエンコードし,重みをHOIの言語埋め込みで初期化する。
我々は,LSE-Sign という新しい損失を,長い尾を持つデータセット上でのマルチラベル学習を強化するために提案する。
我々は,物体検出と人間のポーズを明確なマージンで求める最先端技術よりも優れた,検出不要なHOI分類を可能にする。
論文 参考訳(メタデータ) (2022-03-10T23:35:00Z) - Leveraging Ensembles and Self-Supervised Learning for Fully-Unsupervised
Person Re-Identification and Text Authorship Attribution [77.85461690214551]
完全ラベル付きデータからの学習は、Person Re-IdentificationやText Authorship Attributionなどのマルチメディアフォレスト問題において困難である。
近年の自己教師型学習法は,基礎となるクラスに意味的差異が有る場合に,完全ラベル付きデータを扱う際に有効であることが示されている。
本研究では,異なるクラスからのサンプルが顕著に多様性を持っていない場合でも,ラベルのないデータから学習できるようにすることにより,個人再認識とテキストオーサシップの属性に対処する戦略を提案する。
論文 参考訳(メタデータ) (2022-02-07T13:08:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。