論文の概要: Incomplete Multi-View Multi-Label Learning via Label-Guided Masked View-
and Category-Aware Transformers
- arxiv url: http://arxiv.org/abs/2303.07180v1
- Date: Mon, 13 Mar 2023 15:22:50 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-14 14:23:51.330838
- Title: Incomplete Multi-View Multi-Label Learning via Label-Guided Masked View-
and Category-Aware Transformers
- Title(参考訳): ラベル誘導マスクとカテゴリ認識トランスフォーマによる不完全多視点マルチラベル学習
- Authors: Chengliang Liu, Jie Wen, Xiaoling Luo, Yong Xu
- Abstract要約: 本稿では,ラベル誘導型マスマスキングとカテゴリ認識型トランスフォーマという,多視点多言語学習フレームワークを提案する。
ビュー間の表現力の不均衡を考慮すると、ビュー一貫性の埋め込み特徴を得るために適応的に重み付けされたビュー融合モジュールが提案される。
- 参考スコア(独自算出の注目度): 19.720564730308993
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: As we all know, multi-view data is more expressive than single-view data and
multi-label annotation enjoys richer supervision information than single-label,
which makes multi-view multi-label learning widely applicable for various
pattern recognition tasks. In this complex representation learning problem,
three main challenges can be characterized as follows: i) How to learn
consistent representations of samples across all views? ii) How to exploit and
utilize category correlations of multi-label to guide inference? iii) How to
avoid the negative impact resulting from the incompleteness of views or labels?
To cope with these problems, we propose a general multi-view multi-label
learning framework named label-guided masked view- and category-aware
transformers in this paper. First, we design two transformer-style based
modules for cross-view features aggregation and multi-label classification,
respectively. The former aggregates information from different views in the
process of extracting view-specific features, and the latter learns subcategory
embedding to improve classification performance. Second, considering the
imbalance of expressive power among views, an adaptively weighted view fusion
module is proposed to obtain view-consistent embedding features. Third, we
impose a label manifold constraint in sample-level representation learning to
maximize the utilization of supervised information. Last but not least, all the
modules are designed under the premise of incomplete views and labels, which
makes our method adaptable to arbitrary multi-view and multi-label data.
Extensive experiments on five datasets confirm that our method has clear
advantages over other state-of-the-art methods.
- Abstract(参考訳): マルチビューデータの方がシングルビューデータよりも表現力が高く、マルチラベルアノテーションはシングルラベルよりもリッチな監視情報を楽しむため、多ビューマルチラベル学習は様々なパターン認識タスクに広く適用できる。
この複雑な表現学習問題では、次の3つの主な課題を特徴付けることができる。
一 すべての視点でサンプルの一貫性のある表現を学習する方法
ii)マルチラベルのカテゴリ相関を利用して推論を導く方法
iii)ビューやラベルの不完全性から生じるネガティブな影響を避けるには?
本稿では,この問題を解決するために,ラベルガイド付きマスキングビューとカテゴリ認識トランスフォーマと呼ばれる汎用マルチビューマルチラベル学習フレームワークを提案する。
まず,クロスビュー機能アグリゲーションとマルチラベル分類のためのトランスフォーマティブ型モジュールを2つ設計した。
前者はビュー固有の特徴を抽出する過程で異なるビューから情報を集約し、後者は分類性能を改善するためにサブカテゴリ埋め込みを学習する。
次に,ビュー間の表現力の不均衡を考慮した適応重み付きビュー融合モジュールを提案する。
第3に,教師付き情報の利用を最大化するために,サンプルレベル表現学習におけるラベル多様体の制約を課す。
最後に、全てのモジュールは不完全なビューとラベルの前提で設計されており、メソッドは任意のマルチビューとマルチラベルのデータに適応できる。
5つのデータセットに対する大規模な実験により、我々の手法は他の最先端手法よりも明確な利点があることが確認された。
関連論文リスト
- Multi-Label Knowledge Distillation [86.03990467785312]
本稿では,新しい多ラベル知識蒸留法を提案する。
一方、マルチラベル学習問題をバイナリ分類問題に分割することにより、ロジットからの情報的意味知識を利用する。
一方,ラベルワイド埋め込みの構造情報を活用することにより,学習した特徴表現の識別性を向上する。
論文 参考訳(メタデータ) (2023-08-12T03:19:08Z) - Reliable Representations Learning for Incomplete Multi-View Partial Multi-Label Classification [78.15629210659516]
本稿ではRANKという不完全なマルチビュー部分的マルチラベル分類ネットワークを提案する。
既存の手法に固有のビューレベルの重みを分解し、各サンプルのビューに品質スコアを動的に割り当てる品質対応サブネットワークを提案する。
我々のモデルは、完全なマルチビューマルチラベルデータセットを処理できるだけでなく、欠落したインスタンスやラベルを持つデータセットでも機能する。
論文 参考訳(メタデータ) (2023-03-30T03:09:25Z) - DICNet: Deep Instance-Level Contrastive Network for Double Incomplete
Multi-View Multi-Label Classification [20.892833511657166]
実世界におけるマルチビューマルチラベルデータは、データ収集や手動アノテーションの不確実性のため、一般的に不完全である。
本稿では,DICNetという深層インスタンスレベルのコントラストネットワークを提案し,二重不完全なマルチラベル分類問題に対処する。
我々のDICNetは、マルチビュー多ラベルデータの一貫した識別的表現を捉え、欠落したビューと欠落したラベルの負の影響を避けることに長けている。
論文 参考訳(メタデータ) (2023-03-15T04:24:01Z) - Cross-view Graph Contrastive Representation Learning on Partially
Aligned Multi-view Data [52.491074276133325]
マルチビュー表現学習は、過去数十年間で急速に発展し、多くの分野に応用されてきた。
本稿では,多視点情報を統合してデータアライメントを行い,潜在表現を学習する,新しいクロスビューグラフコントラスト学習フレームワークを提案する。
複数の実データを用いて実験を行い,クラスタリングおよび分類作業における提案手法の有効性を示した。
論文 参考訳(メタデータ) (2022-11-08T09:19:32Z) - TSK Fuzzy System Towards Few Labeled Incomplete Multi-View Data
Classification [24.01191516774655]
これらの課題に対処するために,トランスダクティブ半教師付きマルチビューTSKファジィシステムモデリング法(SSIMV_TSK)を提案する。
提案手法は,未知のビュー計算,ラベルなしデータの擬似ラベル学習,ファジィシステムモデリングをひとつのプロセスに統合し,解釈可能なファジィルールを持つモデルを生成する。
実データを用いた実験の結果,提案手法は最先端の手法よりも優れていた。
論文 参考訳(メタデータ) (2021-10-08T11:41:06Z) - Unsupervised Person Re-Identification with Multi-Label Learning Guided
Self-Paced Clustering [48.31017226618255]
近年、未監修者再確認(Re-ID)が注目されています。
本論文では,教師なしのRe-IDを,MLC(Multi-label Learning Guide Self-paced Clustering)と呼ばれる概念的に斬新かつ単純なフレームワークで対処する。
MLCは主に3つの重要なモジュール(マルチスケールネットワーク、マルチラベル学習モジュール、セルフペースクラスタリングモジュール)で識別的特徴を学習する。
論文 参考訳(メタデータ) (2021-03-08T07:30:13Z) - Embedded Deep Bilinear Interactive Information and Selective Fusion for
Multi-view Learning [70.67092105994598]
本稿では,上記の2つの側面に着目した,新しい多視点学習フレームワークを提案する。
特に、さまざまな深層ニューラルネットワークをトレーニングして、様々なビュー内表現を学習する。
6つの公開データセットの実験により,提案手法の有効性が示された。
論文 参考訳(メタデータ) (2020-07-13T01:13:23Z) - A Concise yet Effective model for Non-Aligned Incomplete Multi-view and
Missing Multi-label Learning [29.827794317616497]
マルチビューのマルチラベルデータから学ぶことは、必然的に、ラベルの欠如、不完全なビュー、非整合ビューの3つの課題に直面します。
既存の手法は主に最初の2つに関係しており、攻撃するには複数の仮定が必要である。
本稿では,1つのハイパーパラメータを持つ簡潔で効果的なモデルを構築することにより,これらを最小限の仮定で満たすことを目標とする。
論文 参考訳(メタデータ) (2020-05-03T03:38:24Z) - Automatically Discovering and Learning New Visual Categories with
Ranking Statistics [145.89790963544314]
我々は,他のクラスをラベル付けした画像コレクションにおいて,新しいクラスを発見する問題に対処する。
汎用クラスタリングモデルを学び、後者を用いて、非競合データ中の新しいクラスを識別する。
我々は,標準分類ベンチマークに対するアプローチと,新しいカテゴリー発見法の性能を,有意なマージンで評価した。
論文 参考訳(メタデータ) (2020-02-13T18:53:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。