論文の概要: MACL: Multi-Label Adaptive Contrastive Learning Loss for Remote Sensing Image Retrieval
- arxiv url: http://arxiv.org/abs/2512.16294v1
- Date: Thu, 18 Dec 2025 08:29:27 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-19 18:10:31.980593
- Title: MACL: Multi-Label Adaptive Contrastive Learning Loss for Remote Sensing Image Retrieval
- Title(参考訳): MACL:リモートセンシング画像検索のためのマルチラベル適応型コントラスト学習損失
- Authors: Amna Amir, Erchan Aptoula,
- Abstract要約: 比較学習の拡張として,Multi-Label Adaptive Contrastive Learning (MACL)を導入している。
ラベル対応サンプリング、周波数感度重み付け、動的温度スケーリングを統合し、一般的なカテゴリと稀なカテゴリの両方でバランスの取れた表現学習を実現する。
- 参考スコア(独自算出の注目度): 4.411658619208916
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Semantic overlap among land-cover categories, highly imbalanced label distributions, and complex inter-class co-occurrence patterns constitute significant challenges for multi-label remote-sensing image retrieval. In this article, Multi-Label Adaptive Contrastive Learning (MACL) is introduced as an extension of contrastive learning to address them. It integrates label-aware sampling, frequency-sensitive weighting, and dynamic-temperature scaling to achieve balanced representation learning across both common and rare categories. Extensive experiments on three benchmark datasets (DLRSD, ML-AID, and WHDLD), show that MACL consistently outperforms contrastive-loss based baselines, effectively mitigating semantic imbalance and delivering more reliable retrieval performance in large-scale remote-sensing archives. Code, pretrained models, and evaluation scripts will be released at https://github.com/amna/MACL upon acceptance.
- Abstract(参考訳): マルチラベルリモートセンシング画像検索において,土地被覆カテゴリ,高度不均衡ラベル分布,複雑なクラス間共起パターンのセマンティックオーバーラップが重要な課題となっている。
本稿では,コントラスト学習の拡張として,マルチラベル適応型コントラスト学習(MACL)を導入する。
ラベル対応サンプリング、周波数感度重み付け、動的温度スケーリングを統合し、一般的なカテゴリと稀なカテゴリの両方でバランスの取れた表現学習を実現する。
3つのベンチマークデータセット(DLRSD、ML-AID、WHDLD)の大規模な実験により、MACLはコントラストロスベースのベースラインを一貫して上回り、意味的不均衡を効果的に軽減し、大規模なリモートセンシングアーカイブでより信頼性の高い検索性能を提供する。
コード、事前トレーニングされたモデル、評価スクリプトは、受け入れ時にhttps://github.com/amna/MACLでリリースされる。
関連論文リスト
- UniME-V2: MLLM-as-a-Judge for Universal Multimodal Embedding Learning [101.62386137855704]
本稿では,Universal Multimodal Embedding (UniME-V2)モデルを提案する。
提案手法はまず,グローバル検索による潜在的な負のセットを構築する。
次に、MLLMを用いてクエリ候補対のセマンティックアライメントを評価するMLLM-as-a-Judge機構を提案する。
これらのスコアは、ハード・ネガティブ・マイニングの基礎となり、偽陰性の影響を緩和し、多様な高品質なハード・ネガティブの識別を可能にする。
論文 参考訳(メタデータ) (2025-10-15T13:07:00Z) - CoLLM: A Large Language Model for Composed Image Retrieval [76.29725148964368]
Composed Image Retrieval (CIR)は、マルチモーダルクエリに基づいた画像検索を目的とした複雑なタスクである。
本稿では,イメージキャプションペアからトリプレットをオンザフライで生成するワンストップフレームワークであるCoLLMを提案する。
我々はLarge Language Models (LLMs) を利用して参照画像の埋め込みと修正テキストを生成する。
論文 参考訳(メタデータ) (2025-03-25T17:59:50Z) - Robust Multi-View Learning via Representation Fusion of Sample-Level Attention and Alignment of Simulated Perturbation [61.64052577026623]
実世界のマルチビューデータセットは、しばしば不均一で不完全である。
本稿では,表現融合とアライメントを同時に行う新しいロバストMVL法(RML)を提案する。
我々のRMLは自己教師型であり、正規化として下流のタスクにも適用できます。
論文 参考訳(メタデータ) (2025-03-06T07:01:08Z) - Dynamic Correlation Learning and Regularization for Multi-Label Confidence Calibration [60.95748658638956]
本稿では,多ラベルシナリオにおける信頼度を適切に評価することを目的としたマルチラベル信頼性タスクを提案する。
既存のシングルラベルキャリブレーション手法では、セマンティックな混乱に対処するために欠かせないカテゴリ相関を考慮できない。
本稿では,多粒度セマンティック相関を利用した動的相関学習と正規化アルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-07-09T13:26:21Z) - ProbMCL: Simple Probabilistic Contrastive Learning for Multi-label Visual Classification [16.415582577355536]
マルチラベル画像分類は、コンピュータビジョンや医用画像など、多くの領域において難しい課題である。
最近の進歩は、グラフベースとトランスフォーマーベースのメソッドを導入し、パフォーマンスを改善し、ラベルの依存関係をキャプチャしている。
本稿では,これらの課題に対処する新しいフレームワークである確率的多ラベルコントラスト学習(ProbMCL)を提案する。
論文 参考訳(メタデータ) (2024-01-02T22:15:20Z) - Deep Active Learning for Multi-Label Classification of Remote Sensing
Images [0.0]
リモートセンシング(RS)における多ラベル分類問題に対する深層能動学習(AL)を導入する。
特に,RS画像のMLCに対する複数のALクエリ関数の有効性について検討する。
全てのクエリ関数は、RSのMLC問題のフレームワークで初めて導入される。
論文 参考訳(メタデータ) (2022-12-02T13:41:21Z) - Learning Self-Supervised Low-Rank Network for Single-Stage Weakly and
Semi-Supervised Semantic Segmentation [119.009033745244]
本稿では,単一段階弱教師付きセマンティックセマンティックセマンティックセマンティクス(WSSS)と半教師付きセマンティクスセマンティクスセマンティクス(SSSS)のための自己教師付き低ランクネットワーク(SLRNet)を提案する。
SLRNetは、画像の異なるビューから複数の注意深いLR表現を同時に予測し、正確な擬似ラベルを学習する。
Pascal VOC 2012、COCO、L2IDデータセットの実験では、SLRNetは最先端のWSSSメソッドとSSSSメソッドの両方で、さまざまな設定で優れています。
論文 参考訳(メタデータ) (2022-03-19T09:19:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。