論文の概要: A Graphical Model for Fusing Diverse Microbiome Data
- arxiv url: http://arxiv.org/abs/2208.09934v1
- Date: Sun, 21 Aug 2022 17:54:39 GMT
- ステータス: 処理完了
- システム内更新日: 2022-08-23 14:05:11.663344
- Title: A Graphical Model for Fusing Diverse Microbiome Data
- Title(参考訳): 多様なマイクロバイオームデータを用いたグラフィカルモデル
- Authors: Mehmet Aktukmak, Haonan Zhu, Marc G. Chevrette, Julia Nepper, Jo
Handelsman, Alfred Hero
- Abstract要約: 本稿では,このような数値データを共同でモデル化するフレキシブルな多項ガウス生成モデルを提案する。
本稿では、潜在変数とモデルのパラメータを推定するための、計算にスケーラブルな変動予測-最大化(EM)アルゴリズムを提案する。
- 参考スコア(独自算出の注目度): 2.385985842958366
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This paper develops a Bayesian graphical model for fusing disparate types of
count data. The motivating application is the study of bacterial communities
from diverse high dimensional features, in this case transcripts, collected
from different treatments. In such datasets, there are no explicit
correspondences between the communities and each correspond to different
factors, making data fusion challenging. We introduce a flexible
multinomial-Gaussian generative model for jointly modeling such count data.
This latent variable model jointly characterizes the observed data through a
common multivariate Gaussian latent space that parameterizes the set of
multinomial probabilities of the transcriptome counts. The covariance matrix of
the latent variables induces a covariance matrix of co-dependencies between all
the transcripts, effectively fusing multiple data sources. We present a
computationally scalable variational Expectation-Maximization (EM) algorithm
for inferring the latent variables and the parameters of the model. The
inferred latent variables provide a common dimensionality reduction for
visualizing the data and the inferred parameters provide a predictive posterior
distribution. In addition to simulation studies that demonstrate the
variational EM procedure, we apply our model to a bacterial microbiome dataset.
- Abstract(参考訳): 本稿では,異なる種類のカウントデータを融合するベイズ図形モデルを提案する。
モチベーション応用は、様々な高次元の特徴から細菌群集の研究であり、この場合、異なる治療法から収集される転写産物である。
このようなデータセットでは、コミュニティ間に明確な対応がなく、それぞれが異なる要因に対応し、データの融合を困難にしている。
このような数値データを共同でモデル化するための柔軟な多項ガウシアン生成モデルを提案する。
この潜在変数モデルは、トランスクリプトームカウントの多項確率のセットをパラメータ化する共通の多変量ガウス的潜在空間を通して観測データを共同で特徴付ける。
潜在変数の共分散行列は、全ての転写物間の共分散行列を誘導し、複数のデータソースを効果的に活用する。
本稿では,モデルの潜在変数とパラメータを推定するための計算スケーラブルな変分期待最大化(em)アルゴリズムを提案する。
推定潜在変数は、データを視覚化するための共通次元還元を提供し、推定パラメータは予測後分布を提供する。
変動EM法を実証するシミュレーション研究に加えて,細菌のマイクロバイオームデータセットに本モデルを適用した。
関連論文リスト
- Fusion of Gaussian Processes Predictions with Monte Carlo Sampling [61.31380086717422]
科学と工学において、私たちはしばしば興味のある変数の正確な予測のために設計されたモデルで作業します。
これらのモデルが現実の近似であることを認識し、複数のモデルを同じデータに適用し、結果を統合することが望ましい。
論文 参考訳(メタデータ) (2024-03-03T04:21:21Z) - Heterogeneous Multi-Task Gaussian Cox Processes [61.67344039414193]
異種相関タスクを共同でモデル化するためのマルチタスクガウスコックスプロセスの新たな拡張を提案する。
MOGPは、分類、回帰、ポイントプロセスタスクの専用可能性のパラメータに先行して、異種タスク間の情報の共有を容易にする。
モデルパラメータを推定するための閉形式反復更新を実現する平均場近似を導出する。
論文 参考訳(メタデータ) (2023-08-29T15:01:01Z) - High-Dimensional Undirected Graphical Models for Arbitrary Mixed Data [2.2871867623460207]
多くのアプリケーションでは、データは異なるタイプの変数にまたがる。
最近の進歩は、バイナリ連続ケースにどのように取り組めるかを示しているが、一般的な混合変数型構造は依然として困難である。
完全混合型の変数を持つデータに対して,フレキシブルでスケーラブルな手法を提案する。
論文 参考訳(メタデータ) (2022-11-21T18:21:31Z) - On the Strong Correlation Between Model Invariance and Generalization [54.812786542023325]
一般化は、見えないデータを分類するモデルの能力をキャプチャする。
不変性はデータの変換におけるモデル予測の一貫性を測定する。
データセット中心の視点から、あるモデルの精度と不変性は異なるテストセット上で線形に相関している。
論文 参考訳(メタデータ) (2022-07-14T17:08:25Z) - Equivariance Discovery by Learned Parameter-Sharing [153.41877129746223]
データから解釈可能な等価性を発見する方法について検討する。
具体的には、モデルのパラメータ共有方式に対する最適化問題として、この発見プロセスを定式化する。
また,ガウスデータの手法を理論的に解析し,研究された発見スキームとオラクルスキームの間の平均2乗ギャップを限定する。
論文 参考訳(メタデータ) (2022-04-07T17:59:19Z) - Mixed Effects Neural ODE: A Variational Approximation for Analyzing the
Dynamics of Panel Data [50.23363975709122]
パネルデータ解析に(固定・ランダムな)混合効果を取り入れたME-NODEという確率モデルを提案する。
我々は、Wong-Zakai定理によって提供されるSDEの滑らかな近似を用いて、我々のモデルを導出できることを示す。
次に、ME-NODEのためのエビデンスに基づく下界を導出し、(効率的な)トレーニングアルゴリズムを開発する。
論文 参考訳(メタデータ) (2022-02-18T22:41:51Z) - Linear Discriminant Analysis with High-dimensional Mixed Variables [10.774094462083843]
本稿では,混合変数を用いた高次元観測の分類手法を提案する。
データを指数関数的に多くのセルに分割するという課題を克服する。
推定精度と誤分類率に関する結果が確立される。
論文 参考訳(メタデータ) (2021-12-14T03:57:56Z) - Bayesian data combination model with Gaussian process latent variable
model for mixed observed variables under NMAR missingness [0.0]
興味のある変数を同時に観測する「(準)単一ソースデータセット」を得ることは困難である。
これらのデータセットは、変数が不足した単一ソースデータセットとして利用する必要がある。
本稿では,データセットが同種であると仮定しないデータ融合法を提案する。
論文 参考訳(メタデータ) (2021-09-01T16:09:55Z) - Multimodal Data Fusion in High-Dimensional Heterogeneous Datasets via
Generative Models [16.436293069942312]
我々は、教師なしの方法で高次元異種データから確率的生成モデルを学習することに興味がある。
本稿では,指数関数的な分布系を通じて異なるデータ型を結合する一般的なフレームワークを提案する。
提案アルゴリズムは、実数値(ガウス)とカテゴリー(マルチノミカル)の特徴を持つ、よく遭遇する異種データセットについて詳細に述べる。
論文 参考訳(メタデータ) (2021-08-27T18:10:31Z) - Accounting for Unobserved Confounding in Domain Generalization [107.0464488046289]
本稿では,データセットの組み合わせから頑健で一般化可能な予測モデルを学習する際の問題点について検討する。
堅牢なモデルを学ぶことの課題の一部は、保存されていない共同設立者の影響にある。
異なるモダリティの医療データに対するアプローチの実証的性能を実証する。
論文 参考訳(メタデータ) (2020-07-21T08:18:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。