論文の概要: MAPLE: Multi-Path Adaptive Propagation with Level-Aware Embeddings for Hierarchical Multi-Label Image Classification
- arxiv url: http://arxiv.org/abs/2603.29784v1
- Date: Tue, 31 Mar 2026 14:23:11 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-01 15:25:03.7118
- Title: MAPLE: Multi-Path Adaptive Propagation with Level-Aware Embeddings for Hierarchical Multi-Label Image Classification
- Title(参考訳): MAPLE:階層型マルチラベル画像分類のためのレベル認識埋め込みを用いたマルチパス適応伝搬
- Authors: Boshko Koloski, Marjan Stoimchev, Jurica Levatić, Dragi Kocev, Sašo Džeroski,
- Abstract要約: MAPLE(Multi-Path Adaptive Propagation with Level-Aware Embeddings)は、グラフ対応のテキスト記述から階層的セマンティック初期化を統合するフレームワークである。
我々はMAPLEが地球観測のための階層的意味論(EO)を効果的かつ効率的にモデル化していることを示す。
CORINEアラインなリモートセンシングデータセット(AID, DFC-15, MLRSNet)の評価は、数ショットで最大で42%改善している。
- 参考スコア(独自算出の注目度): 2.165423459607678
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Hierarchical multi-label classification (HMLC) is essential for modeling structured label dependencies in remote sensing. Yet existing approaches struggle in multi-path settings, where images may activate multiple taxonomic branches, leading to underuse of hierarchical information. We propose MAPLE (Multi-Path Adaptive Propagation with Level-Aware Embeddings), a framework that integrates (i) hierarchical semantic initialization from graph-aware textual descriptions, (ii) graph-based structure encoding via graph convolutional networks (GCNs), and (iii) adaptive multi-modal fusion that dynamically balances semantic priors and visual evidence. An adaptive level-aware objective automatically selects appropriate losses per hierarchy level. Evaluations on CORINE-aligned remote sensing datasets (AID, DFC-15, and MLRSNet) show consistent improvements of up to +42% in few-shot regimes while adding only 2.6% parameter overhead, demonstrating that MAPLE effectively and efficiently models hierarchical semantics for Earth observation (EO).
- Abstract(参考訳): 階層型マルチラベル分類(HMLC)は,リモートセンシングにおける構造化ラベル依存性のモデル化に不可欠である。
しかし、既存のアプローチでは、画像が複数の分類枝を活性化し、階層的な情報の不足につながる、マルチパス設定で苦労している。
統合されたフレームワークであるMAPLE(Multi-Path Adaptive Propagation with Level-Aware Embeddings)を提案する。
(i)グラフ対応テキスト記述からの階層的セマンティック初期化
(II)グラフ畳み込みネットワーク(GCN)によるグラフベース構造符号化
三 意味的先入観と視覚的証拠とを動的にバランスさせる適応的マルチモーダル融合
適応レベル認識目的は、階層レベル毎に適切な損失を自動的に選択する。
CORINEアラインなリモートセンシングデータセット(AID, DFC-15, MLRSNet)の評価では、わずか2.6%のパラメータオーバヘッドを付加し、MAPLEが地球観測のための階層的セマンティクスを効果的に効率的にモデル化していることが示されている。
関連論文リスト
- HELM: Hierarchical and Explicit Label Modeling with Graph Learning for Multi-Label Image Classification [2.165423459607678]
階層型マルチラベル分類(HMLC)は、リモートセンシングにおける複雑なラベル依存のモデル化に不可欠である。
HELM(textitHierarchical and Explicit Label Modeling)は,これらの制約を克服する新しいフレームワークである。
我々は、4つのリモートセンシング画像(UCM, AID, DFC-15, MLRSNet)のデータセットを総合的に評価する。
論文 参考訳(メタデータ) (2026-03-12T10:41:17Z) - CSMCIR: CoT-Enhanced Symmetric Alignment with Memory Bank for Composed Image Retrieval [54.15776146365823]
Composed Image Retrieval (CIR)では、ユーザーは参照画像と操作テキストの両方を使用してターゲットイメージを検索できる。
CSMCIRは3つの相乗的コンポーネントを通して効率的なクエリターゲットアライメントを実現する統一表現フレームワークである。
論文 参考訳(メタデータ) (2026-01-07T09:21:38Z) - Hierarchy-Aware Fine-Tuning of Vision-Language Models [18.244518940229202]
視覚言語モデルは、大規模な画像テキスト事前学習を通じて強力なマルチモーダル表現を学習する。
標準的アプローチはラベルをフラットなカテゴリとして扱い、完全な微調整を必要とする。
構造的一貫性を保ちつつ,いくつかのパラメータを更新する,効率的な階層型微調整フレームワークを提案する。
論文 参考訳(メタデータ) (2025-12-25T06:44:33Z) - Modality Alignment across Trees on Heterogeneous Hyperbolic Manifolds [49.95082206008502]
ツリーを横断するアライメントは、画像とテキストのモダリティの両方に対してツリーのような階層的な特徴を構築し、調整する手法である。
本稿では,中間トランスフォーマー層からの視覚的クラストークンにクロスアテンション機構を適用した意味認識型視覚特徴抽出フレームワークを提案する。
論文 参考訳(メタデータ) (2025-10-31T11:32:15Z) - Towards Fine-Grained Vision-Language Alignment for Few-Shot Anomaly Detection [65.29550320117526]
我々はFinGrainedADという新しいフレームワークを提案し、異常なローカライゼーション性能を改善する。
実験により、提案されたFinGrainedADは、数ショット設定で全体的なパフォーマンスが優れていることが示された。
論文 参考訳(メタデータ) (2025-10-30T13:09:00Z) - Feature Identification for Hierarchical Contrastive Learning [7.655211354400059]
本稿では,2つの新しい階層型コントラスト学習法を提案する。
提案手法は,階層レベルのクラス間関係と不均衡なクラス分布を明示的にモデル化する。
提案手法は,線形評価における最先端性能を実現し,既存の階層的コントラスト学習法を精度で2ポイント向上させる。
論文 参考訳(メタデータ) (2025-10-01T12:46:47Z) - DART: Dual Adaptive Refinement Transfer for Open-Vocabulary Multi-Label Recognition [59.203152078315235]
Open-Vocabulary Multi-Label Recognition (OV-MLR)は、画像内の複数の見えないオブジェクトカテゴリを識別することを目的としている。
ビジョンランゲージ事前学習モデルは強力なオープン語彙基盤を提供するが、弱い監督下では微粒な局所化に苦慮する。
本稿では,これらの制約を克服するためのDART(Dual Adaptive Refinement Transfer)フレームワークを提案する。
論文 参考訳(メタデータ) (2025-08-07T17:22:33Z) - HieraRS: A Hierarchical Segmentation Paradigm for Remote Sensing Enabling Multi-Granularity Interpretation and Cross-Domain Transfer [5.2379726950251655]
HieraRSは、多粒度予測を可能にする新しい階層的解釈パラダイムである。
不均一な木構造階層を持つクロスドメインタスクへのLCLUモデルの効率的な転送をサポートする。
論文 参考訳(メタデータ) (2025-07-11T16:44:01Z) - Category-Adaptive Cross-Modal Semantic Refinement and Transfer for Open-Vocabulary Multi-Label Recognition [59.203152078315235]
本稿では,カテゴリ適応型クロスモーダル・セマンティック・リファインメント・アンド・トランスファー(C$2$SRT)フレームワークを提案する。
提案するフレームワークは,2つの相補的モジュール,すなわち,カテゴリ内セマンティックリファインメント(ISR)モジュールと,カテゴリ間セマンティックトランスファー(IST)モジュールから構成される。
OV-MLRベンチマークの実験は、提案されたC$2$SRTフレームワークが現在の最先端アルゴリズムより優れていることを明らかに示している。
論文 参考訳(メタデータ) (2024-12-09T04:00:18Z) - Semantic Representation and Dependency Learning for Multi-Label Image
Recognition [76.52120002993728]
本稿では,各カテゴリのカテゴリ固有のセマンティック表現を学習するための,新しい,効果的なセマンティック表現と依存性学習(SRDL)フレームワークを提案する。
具体的には,カテゴリー別注意領域(CAR)モジュールを設計し,チャネル/空間的注意行列を生成してモデルを導出する。
また、カテゴリ間のセマンティック依存を暗黙的に学習するオブジェクト消去(OE)モジュールを設計し、セマンティック認識領域を消去する。
論文 参考訳(メタデータ) (2022-04-08T00:55:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。