論文の概要: Identifiable Multimodal Causal Representation Learning under Partial Latent Sharing
- arxiv url: http://arxiv.org/abs/2605.19135v1
- Date: Mon, 18 May 2026 21:34:29 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-20 15:03:09.000731
- Title: Identifiable Multimodal Causal Representation Learning under Partial Latent Sharing
- Title(参考訳): 部分的潜在共有下でのマルチモーダル因果表現学習
- Authors: Manal Benhamza, Marianne Clausel, Myriam Tami,
- Abstract要約: 因果表現学習は、観測データから有意義な潜伏変数とその対応する因果構造を明らかにする。
CRLにおける識別可能性を証明することは本質的に困難であり、この研究でさらに難しい設定であるマルチモーダリティに対処する。
我々は、潜在部分共有構造を持つマルチモーダル観測データを考察する。各モダリティは、因果潜在変数の特定の部分集合から、非線型混合関数を介して生成される。
さらに、我々の識別可能性の結果は、各モードについて、潜伏変数よりも多く観察されるような不完全なシナリオにも当てはまる。
- 参考スコア(独自算出の注目度): 4.400865943835067
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Causal representation learning (CRL) seeks to uncover meaningful latent variables and their corresponding causal structure from high-dimensional observational data. Although its significance, CRL identifiability remains a crucial property, as it ensures the recovery of the mechanisms behind the data generation process, and hence the interpretability and robustness of the representation. Proving identifiability in CRL is intrinsically difficult, and we address in this work an even more challenging setting: multimodality. We consider multimodal observed data with a latent partially shared structure. Each modality is generated, through non linear mixing functions, from a specific subset of causal latent variables. Under flexible assumptions and without imposing any parametric distribution on the latent variables, we establish component-wise identifiability guarantees for the causal latent representation. Our identifiability results, furthermore, apply to the undercomplete scenario where we have, for each modality, more observed than latent variables. To instantiate our theoretical analysis, we introduce a Wasserstein-based module to recover the partially shared latent structure. Due to its differentiability, the latter can be easily integrated into all types of architecture, only requiring minimal changes. Extensive experiments on synthetic and realistic datasets validate the superiority of our approach over SOTA methods.
- Abstract(参考訳): 因果表現学習(CRL)は,高次元観測データから有意義な潜伏変数とその対応する因果構造を明らかにする。
その重要性はあるものの、CRL識別性はデータ生成プロセスの背後にあるメカニズムの回復を確実にし、したがって表現の解釈可能性と堅牢性を保証するため、重要な特性である。
CRLにおける識別可能性を証明することは本質的に困難であり、この研究でさらに難しい設定であるマルチモーダリティに対処する。
潜在部分共有構造を持つマルチモーダル観測データについて検討する。
それぞれのモダリティは、因果潜在変数の特定の部分集合から非線型混合関数を通して生成される。
フレキシブルな仮定の下では、潜伏変数にパラメトリック分布を課すことなく、因果潜伏表現に対する成分的識別可能性を保証する。
さらに、我々の識別可能性の結果は、各モードについて、潜伏変数よりも多く観察されるような不完全なシナリオにも当てはまる。
理論的解析をインスタンス化するために、部分的に共有された潜在構造を復元するワッサーシュタインに基づくモジュールを導入する。
その差別化性のため、後者はすべてのタイプのアーキテクチャに簡単に統合でき、最小限の変更しか必要としない。
合成および現実的なデータセットに関する大規模な実験は、SOTA法よりもアプローチの優位性を検証する。
関連論文リスト
- Hierarchical Contrastive Learning for Multimodal Data [3.1788482285024107]
階層的コントラスト学習(Hierarchical Contrastive Learning)は、グローバルに共有され、部分的に共有され、モダリティ固有の表現を学習するフレームワークである。
マルチモーダルな電子健康記録では、HCLはより情報的な表現をもたらし、常に予測性能を改善する。
論文 参考訳(メタデータ) (2026-04-07T05:53:04Z) - DMMRL: Disentangled Multi-Modal Representation Learning via Variational Autoencoders for Molecular Property Prediction [7.709891405320469]
分子表現を共有(構造関連)およびプライベート(モダリティ特化)潜在空間に分散させる変分オートエンコーダを提案する。
提案手法は, 特性予測に最も有用な特徴を効果的に分離するものである。
7つのベンチマークデータセットの実験的検証は、最先端のアプローチと比較してDMMRLの優れたパフォーマンスを示している。
論文 参考訳(メタデータ) (2026-03-22T07:53:08Z) - Beyond DAGs: A Latent Partial Causal Model for Multimodal Learning [80.44084021062105]
本稿では,非方向エッジで連結された2つの潜在結合変数を特徴とする,多モーダルデータに対する新しい潜在部分因果モデルを提案する。
特定の統計的仮定の下では、多モーダル・コントラッシブ・ラーニングによって学習された表現が、自明な変換までの潜在結合変数に対応することを示す。
事前トレーニングされたCLIPモデルの実験は、非絡み合った表現を具現化し、数ショットの学習を可能にし、さまざまな現実世界のデータセットにわたるドメインの一般化を改善する。
論文 参考訳(メタデータ) (2024-02-09T07:18:06Z) - Mapping the Multiverse of Latent Representations [17.2089620240192]
PRESTOは、潜在表現に依存する機械学習モデルのマルチバースをマッピングするための、原則化されたフレームワークである。
我々のフレームワークは、多種多様な機械学習手法の組み合わせから生じる潜伏空間を特徴付けるために永続的ホモロジーを使用する。
論文 参考訳(メタデータ) (2024-02-02T15:54:53Z) - Identifiable Latent Polynomial Causal Models Through the Lens of Change [82.14087963690561]
因果表現学習は、観測された低レベルデータから潜在的な高レベル因果表現を明らかにすることを目的としている。
主な課題の1つは、識別可能性(identifiability)として知られるこれらの潜伏因果モデルを特定する信頼性の高い保証を提供することである。
論文 参考訳(メタデータ) (2023-10-24T07:46:10Z) - Latent Variable Representation for Reinforcement Learning [131.03944557979725]
モデルに基づく強化学習のサンプル効率を改善するために、潜在変数モデルが学習、計画、探索をいかに促進するかは理論上、実証上、不明である。
状態-作用値関数に対する潜在変数モデルの表現ビューを提供する。これは、抽出可能な変分学習アルゴリズムと楽観主義/悲観主義の原理の効果的な実装の両方を可能にする。
特に,潜伏変数モデルのカーネル埋め込みを組み込んだUPB探索を用いた計算効率の良い計画アルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-12-17T00:26:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。