論文の概要: Leveraging Structure Between Environments: Phylogenetic Regularization Incentivizes Disentangled Representations
- arxiv url: http://arxiv.org/abs/2405.20482v1
- Date: Thu, 30 May 2024 21:08:14 GMT
- ステータス: 処理完了
- システム内更新日: 2024-06-03 18:05:15.033556
- Title: Leveraging Structure Between Environments: Phylogenetic Regularization Incentivizes Disentangled Representations
- Title(参考訳): 環境間のレバレッジ構造:不整合表現を動機づける系統規則化
- Authors: Elliot Layne, Jason Hartford, Sébastien Lachapelle, Mathieu Blanchette, Dhanya Sridhar,
- Abstract要約: 因果表現学習は、経路活性化のような潜伏変数の推測を可能にすることによって科学的理解を促進することができる。
我々は複数の関連するデータセット(環境)とタスクから潜伏変数を推定する手法を開発した。
木に基づく規則化(TBR)は,予測誤差を最小化し,関連する環境を規則化し,類似の予測子を学習する。
- 参考スコア(独自算出の注目度): 4.824771782127179
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Many causal systems such as biological processes in cells can only be observed indirectly via measurements, such as gene expression. Causal representation learning -- the task of correctly mapping low-level observations to latent causal variables -- could advance scientific understanding by enabling inference of latent variables such as pathway activation. In this paper, we develop methods for inferring latent variables from multiple related datasets (environments) and tasks. As a running example, we consider the task of predicting a phenotype from gene expression, where we often collect data from multiple cell types or organisms that are related in known ways. The key insight is that the mapping from latent variables driven by gene expression to the phenotype of interest changes sparsely across closely related environments. To model sparse changes, we introduce Tree-Based Regularization (TBR), an objective that minimizes both prediction error and regularizes closely related environments to learn similar predictors. We prove that under assumptions about the degree of sparse changes, TBR identifies the true latent variables up to some simple transformations. We evaluate the theory empirically with both simulations and ground-truth gene expression data. We find that TBR recovers the latent causal variables better than related methods across these settings, even under settings that violate some assumptions of the theory.
- Abstract(参考訳): 細胞内の生物学的プロセスのような多くの因果系は、遺伝子発現のような測定によってのみ間接的に観察できる。
低レベルの観察を潜伏因果変数に正しくマッピングするタスクである因果表現学習は、経路活性化などの潜伏変数の推測を可能にすることによって科学的理解を促進する可能性がある。
本論文では,複数の関連するデータセット(環境)とタスクから潜在変数を推定する手法を開発する。
実行中の例として、遺伝子発現から表現型を予測するタスクを考える。そこでは、既知の方法で関連している複数の細胞タイプや生物からデータを収集する。
重要な洞察は、遺伝子発現によって引き起こされる潜伏変数から興味の表現型へのマッピングは、密接な関係のある環境間でわずかに変化するということである。
スパース変化をモデル化するために,予測誤差を最小化し,関連する環境を規則化し,類似の予測子を学習するTBR(Tree-Based Regularization)を導入する。
スパース変化の度合いに関する仮定の下では、TBRは真の潜在変数をいくつかの単純な変換まで特定する。
この理論をシミュレーションと基底構造遺伝子発現データの両方で実証的に評価する。
TBRは, 理論のいくつかの仮定に反する設定下であっても, 関連手法よりも潜伏した因果変数を回復することがわかった。
関連論文リスト
- Meta-Learners for Partially-Identified Treatment Effects Across Multiple Environments [67.80453452949303]
観察データから条件平均治療効果(CATE)を推定することは、パーソナライズされた医療など多くの応用に関係している。
ここでは、観測データが複数の環境からやってくる広範囲な環境に焦点を当てる。
任意の機械学習モデルと組み合わせて使用可能な境界を推定するために、異なるモデルに依存しない学習者(いわゆるメタ学習者)を提案する。
論文 参考訳(メタデータ) (2024-06-04T16:31:43Z) - evolSOM: an R Package for evolutionary conservation analysis with SOMs [0.4972323953932129]
本稿では,生物変数の保存を探索・可視化するために,自己組織化マップ(SOM)を利用した新しいRパッケージであるevolSOMを紹介する。
パッケージは自動的に変位を計算し、図形的に表示し、保存された変数と変位した変数を効率よく比較および明らかにする。
EvolSOMを用いて遺伝子および表現型形質の変位を解析し、草葉における表現型分化の潜在的な要因を同定した。
論文 参考訳(メタデータ) (2024-02-09T20:33:48Z) - Identifiable Latent Polynomial Causal Models Through the Lens of Change [82.14087963690561]
因果表現学習は、観測された低レベルデータから潜在的な高レベル因果表現を明らかにすることを目的としている。
主な課題の1つは、識別可能性(identifiability)として知られるこれらの潜伏因果モデルを特定する信頼性の高い保証を提供することである。
論文 参考訳(メタデータ) (2023-10-24T07:46:10Z) - Nonlinearity, Feedback and Uniform Consistency in Causal Structural
Learning [0.8158530638728501]
Causal Discoveryは、観測データから因果構造を学習するための自動探索手法を見つけることを目的としている。
この論文は因果発見における2つの疑問に焦点をあてる: (i) k-三角形の忠実性の代替定義を提供すること (i) (i) はガウス分布の族に適用されるとき強い忠実性よりも弱いこと (ii) 修正版の強忠実性が成り立つという仮定のもとに。
論文 参考訳(メタデータ) (2023-08-15T01:23:42Z) - Conditionally Invariant Representation Learning for Disentangling
Cellular Heterogeneity [25.488181126364186]
本稿では,不必要な変数や乱れに条件付き不変な表現を学習するために,ドメインの可変性を活用する新しい手法を提案する。
単細胞ゲノム学におけるデータ統合など,生物の課題に対して本手法を適用した。
具体的には、提案手法は、対象のタスクと無関係なデータバイアスや興味の因果的説明から生物学的信号を解き放つのに役立つ。
論文 参考訳(メタデータ) (2023-07-02T12:52:41Z) - A Causal Framework for Decomposing Spurious Variations [68.12191782657437]
我々はマルコフモデルとセミマルコフモデルの急激な変分を分解するツールを開発する。
突発効果の非パラメトリック分解を可能にする最初の結果を証明する。
説明可能なAIや公平なAIから、疫学や医学における疑問まで、いくつかの応用がある。
論文 参考訳(メタデータ) (2023-06-08T09:40:28Z) - Score-based Causal Representation Learning with Interventions [54.735484409244386]
本稿では,潜在因果変数を間接的に観察する際の因果表現学習問題について検討する。
目的は、 (i) 未知の線形変換(スケーリングまで)を回復し、 (ii) 潜在変数の下の有向非巡回グラフ(DAG)を決定することである。
論文 参考訳(メタデータ) (2023-01-19T18:39:48Z) - Learning Causal Representations of Single Cells via Sparse Mechanism
Shift Modeling [3.2435888122704037]
本稿では,各摂動を未知の,しかしスパースな,潜伏変数のサブセットを標的とした介入として扱う単一細胞遺伝子発現データの深部生成モデルを提案する。
これらの手法をシミュレーションした単一セルデータ上でベンチマークし、潜伏単位回復、因果的目標同定、領域外一般化における性能を評価する。
論文 参考訳(メタデータ) (2022-11-07T15:47:40Z) - Causal Discovery in Heterogeneous Environments Under the Sparse
Mechanism Shift Hypothesis [7.895866278697778]
機械学習のアプローチは、一般に独立で同一に分散されたデータ(すなわち、d)の仮定に依存する。
実際、この仮定は環境間の分散シフトによってほとんど常に破られる。
そこで我々は,様々な経験的推定器に適用可能なスコアベースアプローチであるメカニズムシフトスコア(MSS)を提案する。
論文 参考訳(メタデータ) (2022-06-04T15:39:30Z) - Typing assumptions improve identification in causal discovery [123.06886784834471]
観測データからの因果発見は、正確な解を常に特定できない難しい課題である。
そこで本研究では,変数の性質に基づいた因果関係を制約する仮説を新たに提案する。
論文 参考訳(メタデータ) (2021-07-22T14:23:08Z) - Learning Disentangled Representations with Latent Variation
Predictability [102.4163768995288]
本稿では,潜在不整合表現の変動予測可能性について述べる。
逆生成プロセス内では、潜時変動と対応する画像対の相互情報を最大化することにより、変動予測可能性を高める。
本研究では,潜在表現の絡み合いを測るために,基礎的構造的生成因子に依存しない評価指標を開発する。
論文 参考訳(メタデータ) (2020-07-25T08:54:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。