論文の概要: HELM: Hierarchical and Explicit Label Modeling with Graph Learning for Multi-Label Image Classification
- arxiv url: http://arxiv.org/abs/2603.11783v1
- Date: Thu, 12 Mar 2026 10:41:17 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-13 14:46:26.021747
- Title: HELM: Hierarchical and Explicit Label Modeling with Graph Learning for Multi-Label Image Classification
- Title(参考訳): HELM:マルチラベル画像分類のためのグラフ学習を用いた階層的・明示的ラベルモデリング
- Authors: Marjan Stoimchev, Boshko Koloski, Jurica Levatić, Dragi Kocev, Sašo Džeroski,
- Abstract要約: 階層型マルチラベル分類(HMLC)は、リモートセンシングにおける複雑なラベル依存のモデル化に不可欠である。
HELM(textitHierarchical and Explicit Label Modeling)は,これらの制約を克服する新しいフレームワークである。
我々は、4つのリモートセンシング画像(UCM, AID, DFC-15, MLRSNet)のデータセットを総合的に評価する。
- 参考スコア(独自算出の注目度): 2.165423459607678
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Hierarchical multi-label classification (HMLC) is essential for modeling complex label dependencies in remote sensing. Existing methods, however, struggle with multi-path hierarchies where instances belong to multiple branches, and they rarely exploit unlabeled data. We introduce HELM (\textit{Hierarchical and Explicit Label Modeling}), a novel framework that overcomes these limitations. HELM: (i) uses hierarchy-specific class tokens within a Vision Transformer to capture nuanced label interactions; (ii) employs graph convolutional networks to explicitly encode the hierarchical structure and generate hierarchy-aware embeddings; and (iii) integrates a self-supervised branch to effectively leverage unlabeled imagery. We perform a comprehensive evaluation on four remote sensing image (RSI) datasets (UCM, AID, DFC-15, MLRSNet). HELM achieves state-of-the-art performance, consistently outperforming strong baselines in both supervised and semi-supervised settings, demonstrating particular strength in low-label scenarios.
- Abstract(参考訳): 階層型マルチラベル分類(HMLC)は、リモートセンシングにおける複雑なラベル依存のモデル化に不可欠である。
しかし、既存の手法では、インスタンスが複数のブランチに属するマルチパス階層と競合し、ラベルのないデータを利用することは滅多にない。
これらの制約を克服する新しいフレームワークであるHELM(\textit{Hierarchical and Explicit Label Modeling})を紹介します。
HELM
i) Vision Transformer内で階層固有のクラストークンを使用して、ニュアンス付きラベルのインタラクションをキャプチャします。
(ii) 階層構造を明示的に符号化し,階層性を考慮した埋め込みを生成するために,グラフ畳み込みネットワークを用いる。
(iii) ラベルのないイメージを効果的に活用するために、自己組織化されたブランチを統合する。
本研究では,4つのリモートセンシング画像(UCM,AID,DFC-15,MLRSNet)を総合的に評価する。
HELMは最先端のパフォーマンスを実現し、教師付き設定と半教師付き設定の両方において一貫して強力なベースラインを上回り、低ラベルシナリオにおいて特に強みを示す。
関連論文リスト
- CORA: Consistency-Guided Semi-Supervised Framework for Reasoning Segmentation [54.53371540755023]
推論セグメンテーションは、複雑でしばしば暗黙的な指示によって参照されるターゲットに対して、ピクセル精度の高いマスクを求める。
我々は、限定ラベル付きデータとラベルなし画像の大きなコーパスから共同で学習する半教師付き推論セグメンテーションフレームワークCORAを提案する。
CORAは最先端の結果を達成し、都市景観理解のためのベンチマークデータセットであるCityscapesにラベル付きイメージを100個まで必要としています。
論文 参考訳(メタデータ) (2025-11-21T20:14:55Z) - Hierarchical Multi-Label Generation with Probabilistic Level-Constraint [3.1427813443719868]
階層的極端多ラベル分類は、従来の多ラベル分類よりも困難である。
我々は,確率的レベル制約(PLC)を用いた生成フレームワークを用いて,特定の分類体系内で階層的なラベルを生成する。
提案手法は,HMGタスクにおいて新たなSOTA性能を実現するが,従来の研究結果よりもモデル出力の制約に優れた性能が得られる。
論文 参考訳(メタデータ) (2025-04-30T07:56:53Z) - Multi-Label Continual Learning using Augmented Graph Convolutional
Network [7.115602040521868]
Multi-Label Continual Learningは、シーケンシャルなマルチラベル画像認識データストリームにクラスインクリメンタルフレームワークを構築する。
この研究は、MLCLにおけるクロスタスクラベル関係を構築することができるAGCN++(Augmented Graph Convolutional Network)を提案する。
提案手法は2つのマルチラベル画像ベンチマークを用いて評価する。
論文 参考訳(メタデータ) (2022-11-27T08:40:19Z) - Use All The Labels: A Hierarchical Multi-Label Contrastive Learning
Framework [75.79736930414715]
本稿では,すべての利用可能なラベルを活用でき,クラス間の階層的関係を維持できる階層型多言語表現学習フレームワークを提案する。
比較損失に階層的ペナルティを併用し,その階層的制約を強制する。
論文 参考訳(メタデータ) (2022-04-27T21:41:44Z) - AGCN: Augmented Graph Convolutional Network for Lifelong Multi-label
Image Recognition [8.06616666179388]
Lifelong Multi-Label (LML)画像認識は、シーケンシャルなマルチラベル画像認識データストリームにオンラインのクラスインクリメンタル分類器を構築する。
LML画像認識の鍵となる課題は、学習データの部分ラベルと古いクラスにおける破滅的蓄積に関するラベル関係の構築である。
逐次認識タスク間でラベル関係を構築することができる拡張グラフ畳み込みネットワーク(AGCN)モデルを提案する。
論文 参考訳(メタデータ) (2022-03-10T18:37:56Z) - MATCH: Metadata-Aware Text Classification in A Large Hierarchy [60.59183151617578]
MATCHはメタデータと階層情報の両方を利用するエンドツーエンドのフレームワークである。
親による各子ラベルのパラメータと出力確率を正規化するさまざまな方法を提案します。
大規模なラベル階層を持つ2つの大規模なテキストデータセットの実験は、MATCHの有効性を示しています。
論文 参考訳(メタデータ) (2021-02-15T05:23:08Z) - An Empirical Study on Large-Scale Multi-Label Text Classification
Including Few and Zero-Shot Labels [49.036212158261215]
大規模なMulti-label Text Classification (LMTC) は、幅広い自然言語処理 (NLP) アプリケーションを持つ。
Label-Wise Attention Networks (LWANs) を用いた最新のLMTCモデル
確率的ラベル木(PLT)に基づく階層的手法がLWANより優れていることを示す。
BERTとLWANを組み合わせた最先端手法を提案する。
論文 参考訳(メタデータ) (2020-10-04T18:55:47Z) - Knowledge-Guided Multi-Label Few-Shot Learning for General Image
Recognition [75.44233392355711]
KGGRフレームワークは、ディープニューラルネットワークと統計ラベル相関の事前知識を利用する。
まず、統計ラベルの共起に基づいて異なるラベルを相関させる構造化知識グラフを構築する。
次に、ラベルセマンティクスを導入し、学習セマンティクス固有の特徴をガイドする。
グラフノードの相互作用を探索するためにグラフ伝搬ネットワークを利用する。
論文 参考訳(メタデータ) (2020-09-20T15:05:29Z) - Hierarchical Image Classification using Entailment Cone Embeddings [68.82490011036263]
まずラベル階層の知識を任意のCNNベースの分類器に注入する。
画像からの視覚的セマンティクスと組み合わせた外部セマンティクス情報の利用が全体的な性能を高めることを実証的に示す。
論文 参考訳(メタデータ) (2020-04-02T10:22:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。