論文の概要: Nonlinear multi-study factor analysis
- arxiv url: http://arxiv.org/abs/2601.18128v1
- Date: Mon, 26 Jan 2026 04:16:47 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-27 15:23:08.67389
- Title: Nonlinear multi-study factor analysis
- Title(参考訳): 非線形マルチスタディ係数解析
- Authors: Gemma E. Moran, Anandi Krishnan,
- Abstract要約: 異なる疾患群における血小板遺伝子発現データについて検討した。
我々は、共有要因と特定要因の両方を可能にする非線形なマルチスタディファクターモデルを考える。
潜在因子が同定されることを証明し,血小板遺伝子発現データに有意な因子を回収する手法を実証する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: High-dimensional data often exhibit variation that can be captured by lower dimensional factors. For high-dimensional data from multiple studies or environments, one goal is to understand which underlying factors are common to all studies, and which factors are study or environment-specific. As a particular example, we consider platelet gene expression data from patients in different disease groups. In this data, factors correspond to clusters of genes which are co-expressed; we may expect some clusters (or biological pathways) to be active for all diseases, while some clusters are only active for a specific disease. To learn these factors, we consider a nonlinear multi-study factor model, which allows for both shared and specific factors. To fit this model, we propose a multi-study sparse variational autoencoder. The underlying model is sparse in that each observed feature (i.e. each dimension of the data) depends on a small subset of the latent factors. In the genomics example, this means each gene is active in only a few biological processes. Further, the model implicitly induces a penalty on the number of latent factors, which helps separate the shared factors from the group-specific factors. We prove that the latent factors are identified, and demonstrate our method recovers meaningful factors in the platelet gene expression data.
- Abstract(参考訳): 高次元データは、しばしば低次元の要因によって捉えられる変動を示す。
複数の研究や環境からの高次元データには、どの要因がすべての研究に共通であるか、どの要因が研究または環境固有ののかを理解することが目的である。
特定の例として、異なる疾患群における血小板遺伝子発現データについて考察する。
このデータでは、因子は共発現される遺伝子の集合に対応しており、いくつかのクラスター(または生物学的経路)がすべての疾患に有効であるのに対して、いくつかのクラスターは特定の疾患にのみ有効であると予想される。
これらの要因を学習するために、共有要因と特定要因の両方を扱える非線形なマルチスタディファクターモデルを考える。
このモデルに適合するために,マルチスタディ・スパース変分オートエンコーダを提案する。
基礎となるモデルは、観測された各特徴(すなわちデータの各次元)が潜在因子の小さな部分集合に依存するという点で疎い。
ゲノム学の例では、各遺伝子はいくつかの生物学的過程においてのみ活性化される。
さらに、モデルは潜在因子の数に対して暗黙的にペナルティを誘導し、共有要因をグループ固有の要因から分離するのに役立つ。
潜在因子が同定されることを実証し,血小板遺伝子発現データに有意な因子を回収する手法を実証する。
関連論文リスト
- Causal Learning for Heterogeneous Subgroups Based on Nonlinear Causal Kernel Clustering [11.9672224014053]
非線形因果クラスタリング法は異種因果学習に有用である。
実験結果から,本手法は異種サブグループを同定し,因果学習の促進に有効であることが示唆された。
論文 参考訳(メタデータ) (2025-01-20T17:43:17Z) - Identifying latent disease factors differently expressed in patient subgroups using group factor analysis [54.67330718129736]
本稿では,サブグループ特異的およびサブグループ共通潜在因子を明らかにするための新しいアプローチを提案する。
提案手法は,正規化されたホースシュー先行群を用いたスパース群因子解析 (GFA) であり,確率計画法を用いて実装した。
論文 参考訳(メタデータ) (2024-10-10T13:12:14Z) - A Causal Framework for Decomposing Spurious Variations [68.12191782657437]
我々はマルコフモデルとセミマルコフモデルの急激な変分を分解するツールを開発する。
突発効果の非パラメトリック分解を可能にする最初の結果を証明する。
説明可能なAIや公平なAIから、疫学や医学における疑問まで、いくつかの応用がある。
論文 参考訳(メタデータ) (2023-06-08T09:40:28Z) - Interventional Causal Representation Learning [75.18055152115586]
因果表現学習は、低レベルの感覚データから高レベルの潜伏因子を抽出しようとする。
介入データは因果表現学習を促進するか?
介入データは、しばしば潜伏因子の支援の幾何学的シグネチャを持つことを示す。
論文 参考訳(メタデータ) (2022-09-24T04:59:03Z) - Selecting the suitable resampling strategy for imbalanced data
classification regarding dataset properties [62.997667081978825]
医学、情報検索、サイバーセキュリティ、ソーシャルメディアなどの多くのアプリケーションドメインでは、分類モデルの導入に使用されるデータセットは、各クラスのインスタンスの不平等な分布を持つことが多い。
この状況は不均衡データ分類と呼ばれ、少数民族の例では予測性能が低い。
オーバーサンプリングとアンダーサンプリングの技術は、各クラスの例の数とバランスをとることでこの問題に対処する、よく知られた戦略である。
論文 参考訳(メタデータ) (2021-12-15T18:56:39Z) - Causal Discovery in Linear Structural Causal Models with Deterministic
Relations [27.06618125828978]
我々は因果発見の課題と観察データに焦点をあてる。
因果構造の特異な識別に必要かつ十分な条件のセットを導出する。
論文 参考訳(メタデータ) (2021-10-30T21:32:42Z) - Relational Subsets Knowledge Distillation for Long-tailed Retinal
Diseases Recognition [65.77962788209103]
本研究では,長尾データを知識に基づいて複数のクラスサブセットに分割し,クラスサブセット学習を提案する。
モデルがサブセット固有の知識の学習に集中するように強制する。
提案手法は長期網膜疾患認識タスクに有効であることが判明した。
論文 参考訳(メタデータ) (2021-04-22T13:39:33Z) - CausalVAE: Structured Causal Disentanglement in Variational Autoencoder [52.139696854386976]
変分オートエンコーダ(VAE)の枠組みは、観測から独立した因子をアンタングルするために一般的に用いられる。
本稿では, 因果内因性因子を因果内因性因子に変換する因果層を含むVOEベースの新しいフレームワークCausalVAEを提案する。
その結果、CausalVAEが学習した因果表現は意味論的に解釈可能であり、DAG(Directed Acyclic Graph)としての因果関係は精度良く同定された。
論文 参考訳(メタデータ) (2020-04-18T20:09:34Z) - Pursuing Sources of Heterogeneity in Modeling Clustered Population [16.936362485508774]
不均一な追従と特徴選択を同時に達成するために、正規化有限混合効果回帰を提案する。
これらの効果の制約付きスパース推定は、共通の効果を持つ変数と不均一な効果を持つ変数の両方を同定する。
アルツハイマー病の遺伝的要因と脳の特徴を関連付けるための画像遺伝学研究、青年期における自殺リスクと学区の特徴との関係を探る公衆衛生学研究、野球選手の給与水準がパフォーマンスと契約状態とどのように関連しているかを理解するためのスポーツ分析研究の3つの応用が提示されている。
論文 参考訳(メタデータ) (2020-03-10T14:59:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。