論文の概要: Causal Representation Learning from Multimodal Biomedical Observations
- arxiv url: http://arxiv.org/abs/2411.06518v3
- Date: Sun, 16 Mar 2025 13:07:14 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-18 21:00:42.277455
- Title: Causal Representation Learning from Multimodal Biomedical Observations
- Title(参考訳): マルチモーダルバイオメディカル観察による因果表現学習
- Authors: Yuewen Sun, Lingjing Kong, Guangyi Chen, Loka Li, Gongxu Luo, Zijian Li, Yixuan Zhang, Yujia Zheng, Mengyue Yang, Petar Stojanov, Eran Segal, Eric P. Xing, Kun Zhang,
- Abstract要約: バイオメディカルデータセットの理解を容易にするために,マルチモーダルデータに対するフレキシブルな識別条件と原理的手法を開発した。
主要な理論的貢献は、モジュラリティ間の因果関係の構造的空間性である。
実世界のヒト表現型データセットの結果は、確立された生物医学研究と一致している。
- 参考スコア(独自算出の注目度): 57.00712157758845
- License:
- Abstract: Prevalent in biomedical applications (e.g., human phenotype research), multimodal datasets can provide valuable insights into the underlying physiological mechanisms. However, current machine learning (ML) models designed to analyze these datasets often lack interpretability and identifiability guarantees, which are essential for biomedical research. Recent advances in causal representation learning have shown promise in identifying interpretable latent causal variables with formal theoretical guarantees. Unfortunately, most current work on multimodal distributions either relies on restrictive parametric assumptions or yields only coarse identification results, limiting their applicability to biomedical research that favors a detailed understanding of the mechanisms. In this work, we aim to develop flexible identification conditions for multimodal data and principled methods to facilitate the understanding of biomedical datasets. Theoretically, we consider a nonparametric latent distribution (c.f., parametric assumptions in previous work) that allows for causal relationships across potentially different modalities. We establish identifiability guarantees for each latent component, extending the subspace identification results from previous work. Our key theoretical contribution is the structural sparsity of causal connections between modalities, which, as we will discuss, is natural for a large collection of biomedical systems. Empirically, we present a practical framework to instantiate our theoretical insights. We demonstrate the effectiveness of our approach through extensive experiments on both numerical and synthetic datasets. Results on a real-world human phenotype dataset are consistent with established biomedical research, validating our theoretical and methodological framework.
- Abstract(参考訳): バイオメディカルな応用(例えばヒトの表現型研究)において、マルチモーダルなデータセットは、基礎となる生理的メカニズムに関する貴重な洞察を提供することができる。
しかしながら、これらのデータセットを分析するために設計された現在の機械学習(ML)モデルは、生体医学研究に不可欠な解釈可能性と識別可能性の保証を欠いていることが多い。
因果表現学習の最近の進歩は、形式的な理論的保証を伴う解釈可能な潜在因果変数の同定において有望であることを示している。
残念なことに、現在のマルチモーダル分布に関するほとんどの研究は制限的なパラメトリックの仮定に依存するか、粗い識別結果しか得られない。
本研究では, バイオメディカルデータセットの理解を容易にするために, マルチモーダルデータに対するフレキシブルな識別条件と原理的手法を開発することを目的とする。
理論的には、潜在的に異なる様相にまたがる因果関係を可能にする非パラメトリック潜在分布(例えば、以前の研究におけるパラメトリックな仮定)を考える。
我々は各潜伏成分に対する識別可能性の保証を確立し、その部分空間の識別結果を以前の作業から拡張する。
我々の重要な理論的貢献は、モーダル間の因果関係の構造的疎結合であり、これは、私たちが議論するように、多くの生体医療システムにとって自然なことである。
理論的洞察をインスタンス化するための実践的な枠組みを実証的に提示する。
数値および合成データセットの広範な実験を通じて,本手法の有効性を実証する。
実世界のヒト表現型データセットの結果は、確立された生物医学研究と一致しており、我々の理論的および方法論的枠組みを検証している。
関連論文リスト
- Representation-Enhanced Neural Knowledge Integration with Application to Large-Scale Medical Ontology Learning [3.010503480024405]
本稿では,関係型の同時学習を実現するため,理論的に保証されたRENKIという統計フレームワークを提案する。
提案フレームワークは,表現学習出力をニューラルネットワークの初期エンティティ埋め込みに組み込んで,知識グラフのスコア関数を近似する。
ヘテロジニアス関係の存在下での重み付けの効果と、非パラメトリックモデルに表現学習を組み込むことの利点を実証する。
論文 参考訳(メタデータ) (2024-10-09T21:38:48Z) - Range, not Independence, Drives Modularity in Biological Inspired Representation [52.48094670415497]
我々は、生物学的にインスピレーションを受けたネットワークが、ソース変数(ソース)の表現をモジュール化する理論を開発する。
我々は、最適な線形オートエンコーダのニューロンがモジュラー化するかどうかを決定するソースのサンプルに対して、必要かつ十分な条件を導出する。
我々の理論はどんなデータセットにも当てはまり、以前の研究で研究された統計的な独立性よりもはるかに長い。
論文 参考訳(メタデータ) (2024-10-08T17:41:37Z) - Learning Discrete Concepts in Latent Hierarchical Models [73.01229236386148]
自然の高次元データから学習する概念は、ヒューマンアライメントと解釈可能な機械学習モデルの構築の可能性を秘めている。
我々は概念を階層的因果モデルを通して関連付けられた離散潜在因果変数として定式化する。
我々は、理論的な主張を合成データ実験で裏付ける。
論文 参考訳(メタデータ) (2024-06-01T18:01:03Z) - Seeing Unseen: Discover Novel Biomedical Concepts via
Geometry-Constrained Probabilistic Modeling [53.7117640028211]
同定された問題を解決するために,幾何制約付き確率的モデリング処理を提案する。
構成された埋め込み空間のレイアウトに適切な制約を課すために、重要な幾何学的性質のスイートを組み込む。
スペクトルグラフ理論法は、潜在的な新規クラスの数を推定するために考案された。
論文 参考訳(メタデータ) (2024-03-02T00:56:05Z) - Conditionally Invariant Representation Learning for Disentangling
Cellular Heterogeneity [25.488181126364186]
本稿では,不必要な変数や乱れに条件付き不変な表現を学習するために,ドメインの可変性を活用する新しい手法を提案する。
単細胞ゲノム学におけるデータ統合など,生物の課題に対して本手法を適用した。
具体的には、提案手法は、対象のタスクと無関係なデータバイアスや興味の因果的説明から生物学的信号を解き放つのに役立つ。
論文 参考訳(メタデータ) (2023-07-02T12:52:41Z) - On the Joint Interaction of Models, Data, and Features [82.60073661644435]
本稿では,データとモデル間の相互作用を実験的に解析する新しいツールであるインタラクションテンソルを紹介する。
これらの観測に基づいて,特徴学習のための概念的枠組みを提案する。
この枠組みの下では、一つの仮説に対する期待された精度と一対の仮説に対する合意はどちらも閉形式で導出することができる。
論文 参考訳(メタデータ) (2023-06-07T21:35:26Z) - Differentiable Agent-based Epidemiology [71.81552021144589]
GradABM(GradABM)は、エージェントベースのモデリングのためのスケーラブルで微分可能な設計で、勾配に基づく学習と自動微分が可能である。
GradABMは、コモディティハードウェア上で数秒で数百万の人口をシミュレートし、ディープニューラルネットワークと統合し、異種データソースを取り込みます。
論文 参考訳(メタデータ) (2022-07-20T07:32:02Z) - Decentralized policy learning with partial observation and mechanical
constraints for multiperson modeling [14.00358511581803]
本稿では,部分的な観察と機械的制約を分散的に表現した逐次生成モデルを提案する。
本手法は実世界のデータを用いて現実的な軌跡を生成するマルチエージェントシミュレータとして利用することができる。
論文 参考訳(メタデータ) (2020-07-07T01:24:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。