論文の概要: Multi-typed Objects Multi-view Multi-instance Multi-label Learning
- arxiv url: http://arxiv.org/abs/2010.02539v1
- Date: Tue, 6 Oct 2020 08:00:02 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-10 05:44:43.476093
- Title: Multi-typed Objects Multi-view Multi-instance Multi-label Learning
- Title(参考訳): マルチタイプオブジェクト マルチビューマルチインスタンスマルチラベル学習
- Authors: Yuanlin Yang, Guoxian Yu, Jun Wang, Carlotta Domeniconi, Xiangliang
Zhang
- Abstract要約: M4Lは、M3L(Multi-view Multi-instance Multi-label Learning)よりも汎用的で強力である
我々は結合行列分解に基づく解(M4L-JMF)を開発する。
M4L-JMFは、この新たな問題に対する既存のM3Lソリューションの簡単な適応よりも、はるかに優れた結果が得られる。
- 参考スコア(独自算出の注目度): 39.77570541880894
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Multi-typed objects Multi-view Multi-instance Multi-label Learning (M4L)
deals with interconnected multi-typed objects (or bags) that are made of
diverse instances, represented with heterogeneous feature views and annotated
with a set of non-exclusive but semantically related labels. M4L is more
general and powerful than the typical Multi-view Multi-instance Multi-label
Learning (M3L), which only accommodates single-typed bags and lacks the power
to jointly model the naturally interconnected multi-typed objects in the
physical world. To combat with this novel and challenging learning task, we
develop a joint matrix factorization based solution (M4L-JMF). Particularly,
M4L-JMF firstly encodes the diverse attributes and multiple
inter(intra)-associations among multi-typed bags into respective data matrices,
and then jointly factorizes these matrices into low-rank ones to explore the
composite latent representation of each bag and its instances (if any). In
addition, it incorporates a dispatch and aggregation term to distribute the
labels of bags to individual instances and reversely aggregate the labels of
instances to their affiliated bags in a coherent manner. Experimental results
on benchmark datasets show that M4L-JMF achieves significantly better results
than simple adaptions of existing M3L solutions on this novel problem.
- Abstract(参考訳): マルチタイプオブジェクト Multi-view Multi-instance Multi-label Learning (M4L) は、多種多様なインスタンスで構成され、異種の特徴ビューで表現され、非排他的だがセマンティックに関連付けられたラベルのセットで注釈付けされた相互接続されたマルチタイプオブジェクト(またはバッグ)を扱う。
m4lは、通常のマルチビューマルチインスタンスマルチラベル学習(m3l:multi-view multi-instance multi-label learning)よりも一般的で強力である。
この新規で挑戦的な学習課題に対処するため、我々はM4L-JMF(Joint matrix factorization based solution)を開発した。
特に、M4L-JMFは、まず多種多様な属性と多種間(イントラ)結合を各データ行列にエンコードし、次いでこれらの行列を低ランクに分解し、各バッグとそのインスタンスの複合潜在表現を探索する。
さらに、個々のインスタンスにバッグのラベルを配布し、関連バッグにインスタンスのラベルを逆に集約するために、ディスパッチとアグリゲーションの用語が組み込まれている。
ベンチマーク実験の結果,M4L-JMFは既存のM3Lソリューションの新たな問題への適応よりもはるかに優れた結果が得られた。
関連論文リスト
- MMRel: A Relation Understanding Dataset and Benchmark in the MLLM Era [72.95901753186227]
MMRel(Multi-Modal Relation Understanding)は、Multi-Modal Large Language Models (MLLM)とのオブジェクト間関係を研究するための包括的データセットである。
MMRelには3つの特徴がある: (i) 大規模かつ高い多様性を保証する3つの異なるドメインから得られる15K以上の質問応答ペア; (ii) MLLMが幻覚によってしばしば失敗する非常に珍しい関係を持つサブセットを含む; (iii) オブジェクト間関係のために手作業で検証された高品質なラベルを提供する。
論文 参考訳(メタデータ) (2024-06-13T13:51:59Z) - CARAT: Contrastive Feature Reconstruction and Aggregation for
Multi-Modal Multi-Label Emotion Recognition [18.75994345925282]
マルチモーダルマルチラベル感情認識(MMER)は、複数のモーダルから関連する感情を識別することを目的としている。
MMERの課題は、異種データから複数のラベルの識別機能を効果的に取得する方法である。
本稿では,MMERタスクのためのContrAstive Feature Restruction and AggregaTion(CARAT)を提案する。
論文 参考訳(メタデータ) (2023-12-15T20:58:05Z) - Multi-Grained Multimodal Interaction Network for Entity Linking [65.30260033700338]
マルチモーダルエンティティリンクタスクは、マルチモーダル知識グラフへの曖昧な言及を解決することを目的としている。
MELタスクを解決するための新しいMulti-Grained Multimodal InteraCtion Network $textbf(MIMIC)$ frameworkを提案する。
論文 参考訳(メタデータ) (2023-07-19T02:11:19Z) - Disambiguated Attention Embedding for Multi-Instance Partial-Label
Learning [68.56193228008466]
多くの実世界のタスクでは、関連するオブジェクトは、候補ラベルセットに関連付けられたマルチインスタンスバッグとして表現することができる。
既存のMIPLアプローチは、各インスタンスに拡張候補ラベルセットを割り当て、インスタンスレベルのラベルからバッグレベルのラベルを集約することで、インスタンス空間のパラダイムに従っている。
本稿では,DEMIPLという直感的なアルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-05-26T13:25:17Z) - Reliable Representations Learning for Incomplete Multi-View Partial Multi-Label Classification [78.15629210659516]
本稿ではRANKという不完全なマルチビュー部分的マルチラベル分類ネットワークを提案する。
既存の手法に固有のビューレベルの重みを分解し、各サンプルのビューに品質スコアを動的に割り当てる品質対応サブネットワークを提案する。
我々のモデルは、完全なマルチビューマルチラベルデータセットを処理できるだけでなく、欠落したインスタンスやラベルを持つデータセットでも機能する。
論文 参考訳(メタデータ) (2023-03-30T03:09:25Z) - Single-Stage Broad Multi-Instance Multi-Label Learning (BMIML) with
Diverse Inter-Correlations and its application to medical image
classification [10.403614735252503]
既存のMIML手法は、いくつかの問題により比較的低い精度と訓練効率に悩まされている。
BMIMLは、大容量の医用画像データセットであっても、既存の手法よりも精度が高く、ほとんどのMIML手法よりもはるかに高速である。
論文 参考訳(メタデータ) (2022-09-06T16:28:54Z) - Multi-modal Contrastive Representation Learning for Entity Alignment [57.92705405276161]
マルチモーダルなエンティティアライメントは、2つの異なるマルチモーダルな知識グラフ間で等価なエンティティを識別することを目的としている。
マルチモーダルコントラスト学習に基づくエンティティアライメントモデルであるMCLEAを提案する。
特に、MCLEAはまず複数のモダリティから複数の個別表現を学習し、その後、モダリティ内およびモダリティ間相互作用を共同でモデル化するコントラスト学習を行う。
論文 参考訳(メタデータ) (2022-09-02T08:59:57Z) - Semi-Supervised Multi-Modal Multi-Instance Multi-Label Deep Network with
Optimal Transport [24.930976128926314]
M3DN (Multi-modal Multi-instance Multi-label Deep Network) を提案する。
M3DNは、M3学習をエンドツーエンドのマルチモーダルディープネットワークで考慮し、異なるモーダルバッグレベルの予測間で一貫性の原則を利用します。
これにより、M3DNSはラベルを予測し、ラベル相関を同時に活用できる。
論文 参考訳(メタデータ) (2021-04-17T09:18:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。