論文の概要: Exploring Partial Multi-Label Learning via Integrating Semantic Co-occurrence Knowledge
- arxiv url: http://arxiv.org/abs/2507.05992v1
- Date: Tue, 08 Jul 2025 13:53:28 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-09 16:34:38.144033
- Title: Exploring Partial Multi-Label Learning via Integrating Semantic Co-occurrence Knowledge
- Title(参考訳): 意味的共起知識の統合による部分的マルチラベル学習の探索
- Authors: Xin Wu, Fei Teng, Yue Feng, Kaibo Shi, Zhuosheng Lin, Ji Zhang, James Wang,
- Abstract要約: 部分的マルチラベル学習は、不完全な注釈付きデータから知識を抽出することを目的としている。
主な課題は、ラベルとインスタンス間のあいまいな関係を正確に識別することである。
本稿では,セマンティック・コレクレンス・インサイト・ネットワーク(SCINet)を提案する。
- 参考スコア(独自算出の注目度): 30.05176623784069
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Partial multi-label learning aims to extract knowledge from incompletely annotated data, which includes known correct labels, known incorrect labels, and unknown labels. The core challenge lies in accurately identifying the ambiguous relationships between labels and instances. In this paper, we emphasize that matching co-occurrence patterns between labels and instances is key to addressing this challenge. To this end, we propose Semantic Co-occurrence Insight Network (SCINet), a novel and effective framework for partial multi-label learning. Specifically, SCINet introduces a bi-dominant prompter module, which leverages an off-the-shelf multimodal model to capture text-image correlations and enhance semantic alignment. To reinforce instance-label interdependencies, we develop a cross-modality fusion module that jointly models inter-label correlations, inter-instance relationships, and co-occurrence patterns across instance-label assignments. Moreover, we propose an intrinsic semantic augmentation strategy that enhances the model's understanding of intrinsic data semantics by applying diverse image transformations, thereby fostering a synergistic relationship between label confidence and sample difficulty. Extensive experiments on four widely-used benchmark datasets demonstrate that SCINet surpasses state-of-the-art methods.
- Abstract(参考訳): 部分的マルチラベル学習は、既知の正しいラベル、既知の不正確なラベル、未知のラベルを含む、不完全な注釈付きデータから知識を抽出することを目的としている。
主な課題は、ラベルとインスタンス間のあいまいな関係を正確に識別することである。
本稿では,ラベルとインスタンス間の共起パターンのマッチングが,この問題に対処する鍵となることを強調する。
そこで本研究では,セマンティック・コレクレンス・インサイト・ネットワーク(SCINet)を提案する。
具体的には、SCINetは、オフザシェルのマルチモーダルモデルを利用して、テキストイメージの相関を捉え、セマンティックアライメントを強化する、双方向プロンプトモジュールを導入している。
インスタンス-ラベル間の相互依存性の強化を目的として, インスタンス-ラベル間の相関関係, インスタンス-ラベル間の相互関係, および共起パターンを協調的にモデル化する相互モダリティ融合モジュールを開発した。
さらに,多彩な画像変換を適用することで,モデル固有のデータセマンティクスの理解を深め,ラベルの信頼度とサンプルの難易度との相乗的関係を育む本質的なセマンティクス強化戦略を提案する。
広く使用されている4つのベンチマークデータセットに対する大規模な実験は、SCINetが最先端の手法を超越していることを示している。
関連論文リスト
- Semantic-Aligned Learning with Collaborative Refinement for Unsupervised VI-ReID [82.12123628480371]
教師なしの人物再識別(USL-VI-ReID)は、モデル学習のための人間のアノテーションを使わずに、同じ人物の歩行者像を異なるモードでマッチングすることを目指している。
従来の手法では、ラベルアソシエーションアルゴリズムを用いて異質な画像の擬似ラベルを統一し、グローバルな特徴学習のためのコントラスト学習フレームワークを設計していた。
本稿では,各モダリティによって強調される特定のきめ細かいパターンを対象とするSALCR(Semantic-Aligned Learning with Collaborative Refinement)フレームワークを提案する。
論文 参考訳(メタデータ) (2025-04-27T13:58:12Z) - Multi-Label Contrastive Learning : A Comprehensive Study [48.81069245141415]
マルチラベルの分類は、研究と産業の両方において重要な領域として現れてきた。
対照的な学習をマルチラベル分類に適用することは、ユニークな課題である。
多様な環境における多ラベル分類のためのコントラスト学習損失の詳細な研究を行う。
論文 参考訳(メタデータ) (2024-11-27T20:20:06Z) - Multi-Label Bayesian Active Learning with Inter-Label Relationships [3.88369051454137]
両課題に対処する多ラベルアクティブラーニング戦略を提案する。
本手法は, 漸進的に更新された正相関行列と負相関行列を組み込んで, 共起関係と解離関係を捉える。
私たちの戦略は、いくつかの確立された方法と比較して、信頼性と優れたパフォーマンスを継続的に達成します。
論文 参考訳(メタデータ) (2024-11-26T23:28:54Z) - CARAT: Contrastive Feature Reconstruction and Aggregation for
Multi-Modal Multi-Label Emotion Recognition [18.75994345925282]
マルチモーダルマルチラベル感情認識(MMER)は、複数のモーダルから関連する感情を識別することを目的としている。
MMERの課題は、異種データから複数のラベルの識別機能を効果的に取得する方法である。
本稿では,MMERタスクのためのContrAstive Feature Restruction and AggregaTion(CARAT)を提案する。
論文 参考訳(メタデータ) (2023-12-15T20:58:05Z) - mCL-NER: Cross-Lingual Named Entity Recognition via Multi-view
Contrastive Learning [54.523172171533645]
CrossNERは多言語コーパスの不足により不均一な性能から生じる課題に直面している。
言語横断的名前付きエンティティ認識(mCL-NER)のためのマルチビューコントラスト学習を提案する。
40言語にまたがるXTREMEベンチマーク実験では、従来のデータ駆動型およびモデルベースアプローチよりもmCL-NERの方が優れていることを示した。
論文 参考訳(メタデータ) (2023-08-17T16:02:29Z) - Knowledge-Guided Multi-Label Few-Shot Learning for General Image
Recognition [75.44233392355711]
KGGRフレームワークは、ディープニューラルネットワークと統計ラベル相関の事前知識を利用する。
まず、統計ラベルの共起に基づいて異なるラベルを相関させる構造化知識グラフを構築する。
次に、ラベルセマンティクスを導入し、学習セマンティクス固有の特徴をガイドする。
グラフノードの相互作用を探索するためにグラフ伝搬ネットワークを利用する。
論文 参考訳(メタデータ) (2020-09-20T15:05:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。