論文の概要: Microbiome subcommunity learning with logistic-tree normal latent
Dirichlet allocation
- arxiv url: http://arxiv.org/abs/2109.05386v1
- Date: Sat, 11 Sep 2021 22:52:12 GMT
- ステータス: 処理完了
- システム内更新日: 2021-09-14 15:27:15.371484
- Title: Microbiome subcommunity learning with logistic-tree normal latent
Dirichlet allocation
- Title(参考訳): ロジスティックツリー正規潜在ディリクレ配置を用いたマイクロバイオームサブコミュニティ学習
- Authors: Patrick LeBlanc and Li Ma
- Abstract要約: 混合メンバーシップモデル(MM)は微生物種の潜伏サブコミュニティを特定するために微生物組成データに適用されている。
本稿では,あるセントロイドの組成の周辺における各サブコミュニティの組成の変動を許容する新しいMMモデルを提案する。
- 参考スコア(独自算出の注目度): 3.960875974762257
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Mixed-membership (MM) models such as Latent Dirichlet Allocation (LDA) have
been applied to microbiome compositional data to identify latent subcommunities
of microbial species. However, microbiome compositional data, especially those
collected from the gut, typically display substantial cross-sample
heterogeneities in the subcommunity composition which current MM methods do not
account for. To address this limitation, we incorporate the logistic-tree
normal (LTN) model -- using the phylogenetic tree structure -- into the LDA
model to form a new MM model. This model allows variation in the composition of
each subcommunity around some ``centroid'' composition. Incorporation of
auxiliary P\'olya-Gamma variables enables a computationally efficient collapsed
blocked Gibbs sampler to carry out Bayesian inference under this model. We
compare the new model and LDA and show that in the presence of large
cross-sample heterogeneity, under the LDA model the resulting inference can be
extremely sensitive to the specification of the total number of subcommunities
as it does not account for cross-sample heterogeneity. As such, the popular
strategy in other applications of MM models of overspecifying the number of
subcommunities -- and hoping that some meaningful subcommunities will emerge
among artificial ones -- can lead to highly misleading conclusions in the
microbiome context. In contrast, by accounting for such heterogeneity, our MM
model restores the robustness of the inference in the specification of the
number of subcommunities and again allows meaningful subcommunities to be
identified under this strategy.
- Abstract(参考訳): LDA(Latent Dirichlet Allocation)のような混合メンバーシップ(MM)モデルは、微生物種の潜伏サブコミュニティを特定するために微生物組成データに適用されている。
しかし、特に腸から採取された微生物組成データでは、現在のMM法では説明できないサブコミュニティ組成にかなりのクロスサンプル不均一性を示すのが一般的である。
この制限に対処するために、ロジスティック・ツリー・ノーマル(ltn)モデル -- 系統樹構造を使用する -- をldaモデルに組み込んで、新しいmmモデルを形成する。
このモデルは、ある `centroid'' 構成の周りの各サブコミュニティの組成の変動を可能にする。
補助的なP\'olya-Gamma変数を組み込むことで、計算効率のよい崩壊したギブスサンプリング器がベイズ推定を行うことができる。
我々は,新しいモデルとLDAを比較し,LDAモデルの下では大きなクロスサンプル不均一性が存在する場合,その結果の推測は,クロスサンプル不均一性を考慮していないため,サブコミュニティの総数に極めて敏感であることを示す。
そのため、MMモデルの他の応用における一般的な戦略は、サブコミュニティの数を過剰に指定し、有意義なサブコミュニティが人工的に現れることを期待している。
対照的に,このような異質性を考慮し,mmモデルは,サブコミュニティ数の仕様における推論の頑健さを復元し,また,この戦略の下で意味のあるサブコミュニティを特定することを可能にする。
関連論文リスト
- Meta Flow Matching: Integrating Vector Fields on the Wasserstein Manifold [83.18058549195855]
自然科学における複数の過程は、確率密度のワッサーシュタイン多様体上のベクトル場として表さなければならない。
特に、疾患の発生とその治療反応が患者固有の細胞の微小環境に依存するパーソナライズド医療において重要である。
本稿では,これらのベクトル場をワッサーシュタイン多様体上で積分するメタフローマッチング(Meta Flow Matching, MFM)を提案する。
論文 参考訳(メタデータ) (2024-08-26T20:05:31Z) - Deep asymmetric mixture model for unsupervised cell segmentation [4.211173851121561]
本稿では,教師なし細胞分割のための新しい非対称混合モデルを提案する。
これは、ある多変量ガウス混合モデルをログライクリフと自己教師付き最適化関数で集約することによって構築される。
提案した非対称混合モデルは,そのセグメントを含むセルセグメンテーションにおいて,既存の最先端の教師なしモデルよりも優れている。
論文 参考訳(メタデータ) (2024-06-03T22:12:22Z) - sc-OTGM: Single-Cell Perturbation Modeling by Solving Optimal Mass Transport on the Manifold of Gaussian Mixtures [0.9674145073701153]
sc-OTGMは、scRNAseqデータが生成される誘導バイアスに基づく教師なしモデルである。
sc-OTGMは細胞状態の分類、異なる遺伝子発現の解析、標的同定のための遺伝子ランキングに有効である。
また、下流遺伝子制御に対する単一遺伝子の摂動の影響を予測し、特定の細胞状態に条件付けられた合成scRNA-seqデータを生成する。
論文 参考訳(メタデータ) (2024-05-06T06:46:11Z) - Toward the Identifiability of Comparative Deep Generative Models [7.5479347719819865]
比較深部生成モデル(DGM)における識別可能性の理論を提案する。
これらのモデルは、一般的な混合関数のクラスにおいて識別性に欠けるが、混合関数が断片的アフィンであるときに驚くほど識別可能であることを示す。
また, モデルミス種別の影響についても検討し, 従来提案されていた比較DGMの正則化手法が, 潜伏変数の数が事前に分かっていない場合に, 識別可能性を高めることを実証的に示す。
論文 参考訳(メタデータ) (2024-01-29T06:10:54Z) - Mixed Models with Multiple Instance Learning [51.440557223100164]
一般化線形混合モデル(GLMM)とMultiple Instance Learning(MIL)を統合するフレームワークであるMixMILを紹介する。
実験結果から,MixMILは単一セルデータセットにおいて既存のMILモデルより優れていることがわかった。
論文 参考訳(メタデータ) (2023-11-04T16:42:42Z) - A Novel Unified Conditional Score-based Generative Framework for
Multi-modal Medical Image Completion [54.512440195060584]
我々は、スコアベース生成モデル(SGM)を活用するために、統一多モードスコアベース生成モデル(UMM-CSGM)を提案する。
UMM-CSGMは、新しいマルチインマルチアウトコンディションスコアネットワーク(mm-CSN)を用いて、クロスモーダル条件分布の包括的集合を学習する。
BraTS19データセットの実験により、UMM-CSGMは腫瘍誘発病変における不均一な増強と不規則な領域をより確実に合成できることが示された。
論文 参考訳(メタデータ) (2022-07-07T16:57:21Z) - Gaussian Latent Dirichlet Allocation for Discrete Human State Discovery [1.057079240576682]
離散状態発見問題に対する教師なし確率モデルであるGaussian Latent Dirichlet Allocation (GLDA)を提案する。
GLDAは、自然言語処理において人気のあるトピックモデルであるLatent Dirichlet Allocation (LDA)から個々の混合構造を借りている。
両データセットにおいて,GLDAを学習したクラスウェイトは,臨床評価したうつ病,不安,ストレススコアと,ベースラインのGMMよりも有意に高い相関性を示した。
論文 参考訳(メタデータ) (2022-06-28T18:33:46Z) - A new LDA formulation with covariates [3.1690891866882236]
ラテント・ディリクレ・アロケーション・モデルは混合メンバーシップ・クラスタを作成する一般的な方法である。
共変量を含むLDAモデルの新たな定式化を提案する。
モデルパラメータを推定するためにギブスサンプリングアルゴリズムを用いてスライスサンプリングを行う。
このモデルは,コロナウイルスのテキストマイニング,雑貨買い物かごの分析,バロコロラド島(パナマ)の樹木種の生態という,3つの異なる領域の実際のデータセットを用いて説明されている。
論文 参考訳(メタデータ) (2022-02-18T19:58:24Z) - Entropy Minimizing Matrix Factorization [102.26446204624885]
NMF(Nonnegative Matrix Factorization)は、広く使用されているデータ分析技術であり、多くの実際のタスクで印象的な結果をもたらしました。
本研究では,上述の問題に対処するために,EMMF (Entropy Minimizing Matrix Factorization framework) を開発した。
通常、外れ値が通常のサンプルよりもはるかに小さいことを考えると、行列分解のために新しいエントロピー損失関数が確立される。
論文 参考訳(メタデータ) (2021-03-24T21:08:43Z) - Robust Finite Mixture Regression for Heterogeneous Targets [70.19798470463378]
本稿では,サンプルクラスタの探索と,複数の不完全な混合型ターゲットを同時にモデル化するFMRモデルを提案する。
我々は、高次元の学習フレームワークの下で、無症状のオラクルのパフォーマンス境界をモデルに提供します。
その結果,我々のモデルは最先端の性能を達成できることがわかった。
論文 参考訳(メタデータ) (2020-10-12T03:27:07Z) - A Rigorous Link Between Self-Organizing Maps and Gaussian Mixture Models [78.6363825307044]
本研究は、自己組織化マップ(SOM)とガウス混合モデル(GMM)の関係を数学的に扱うものである。
我々は,エネルギーベースSOMモデルを勾配勾配下降と解釈できることを示した。
このリンクはSOMsを生成確率モデルとして扱うことができ、SOMsを使用して外れ値を検出したりサンプリングしたりするための正式な正当性を与える。
論文 参考訳(メタデータ) (2020-09-24T14:09:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。