論文の概要: Poisson Hierarchical Indian Buffet Processes-With Indications for Microbiome Species Sampling Models
- arxiv url: http://arxiv.org/abs/2502.01919v2
- Date: Mon, 25 Aug 2025 02:30:35 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-26 14:31:50.484407
- Title: Poisson Hierarchical Indian Buffet Processes-With Indications for Microbiome Species Sampling Models
- Title(参考訳): Poisson Hierarchical Indian Buffet Processs-With Indications for Microbiome species Smpling Models (特集 バイオメカニクスとバイオメカニクス)
- Authors: Lancelot F. James, Juho Lee, Abhinav Pandey,
- Abstract要約: 複雑で疎数なデータに対する課題に対処するために,新しい種類の種サンプリングモデルを導入する。
我々の研究は、遺伝学、商取引、テキスト分析における階層的カウントモデリングのための、広く適用可能な方法論を提供する。
- 参考スコア(独自算出の注目度): 11.64027121881932
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We introduce the Poisson Hierarchical Indian Buffet Process (PHIBP), a new class of species sampling models designed to address the challenges of complex, sparse count data by facilitating information sharing across and within groups. Our theoretical developments enable a tractable Bayesian nonparametric framework with machine learning elements, accommodating a potentially infinite number of species (taxa) whose parameters are learned from data. Focusing on microbiome analysis, we address key gaps by providing a flexible multivariate count model that accounts for overdispersion and robustly handles diverse data types (OTUs, ASVs). We introduce novel parameters reflecting species abundance and diversity. The model borrows strength across groups while explicitly distinguishing between technical and biological zeros to interpret sparse co-occurrence patterns. This results in a framework with tractable posterior inference, exact generative sampling, and a principled solution to the unseen species problem. We describe extensions where domain experts can incorporate knowledge through covariates and structured priors, with potential for strain-level analysis. While motivated by ecology, our work provides a broadly applicable methodology for hierarchical count modeling in genetics, commerce, and text analysis, and has significant implications for the broader theory of species sampling models arising in probability and statistics.
- Abstract(参考訳): PHIBP(Poisson Hierarchical Indian Buffet Process)は,グループ内およびグループ間の情報共有を容易にすることで,複雑で疎数なデータ収集の課題に対処するために設計された,新しい種のサンプリングモデルである。
我々の理論的発展は、データからパラメータが学習される潜在的に無限の種(タキサ)を収容する、機械学習要素を持つトラクタブルベイズ非パラメトリックフレームワークを可能にする。
マイクロバイオーム分析に焦点をあて、過分散を考慮し、多様なデータ型(OTU, ASV)を頑健に扱う柔軟な多変量数モデルを提供することにより、キーギャップに対処する。
種数と多様性を反映する新しいパラメータを導入する。
このモデルはグループ間で強度を借り、技術的なゼロと生物学的ゼロを明確に区別し、スパース共起パターンを解釈する。
この結果、抽出可能な後部推論、正確な生成サンプリング、および目に見えない種問題に対する原則的解決の枠組みが得られた。
ドメインエキスパートが知識を共変量や構造化前駆体を通じて組み込むことができる拡張について述べる。
本研究は, 生態学に動機付けられながら, 遺伝学, 商業学, テキスト分析における階層的カウントモデリングの方法論として広く応用されており, 確率と統計に起因した種標本モデルに関するより広範な理論に重要な意味を持つ。
関連論文リスト
- Hierarchical Sparse Bayesian Multitask Model with Scalable Inference for Microbiome Analysis [1.361248247831476]
本稿では,一般的なマルチタスク二元分類学習問題に適用可能な階層型ベイズ的マルチタスク学習モデルを提案する。
後方分布を近似するために,変分推定に基づく計算効率の良い推論アルゴリズムを導出する。
各種合成データセットに対する新しいアプローチの可能性を示し, マイクロバイオームプロファイルに基づくヒトの健康状態の予測を行う。
論文 参考訳(メタデータ) (2025-02-04T18:23:22Z) - Causal Representation Learning from Multimodal Biological Observations [57.00712157758845]
我々は,マルチモーダルデータに対するフレキシブルな識別条件の開発を目指している。
我々は、各潜伏成分の識別可能性を保証するとともに、サブスペース識別結果を事前の作業から拡張する。
我々の重要な理論的要素は、異なるモーダル間の因果関係の構造的空間性である。
論文 参考訳(メタデータ) (2024-11-10T16:40:27Z) - GenBench: A Benchmarking Suite for Systematic Evaluation of Genomic Foundation Models [56.63218531256961]
我々はGenomic Foundation Modelsの有効性を評価するためのベンチマークスイートであるGenBenchを紹介する。
GenBenchはモジュラーで拡張可能なフレームワークを提供し、様々な最先端の方法論をカプセル化している。
本稿では,タスク固有性能におけるモデルアーキテクチャとデータセット特性の相互作用のニュアンス解析を行う。
論文 参考訳(メタデータ) (2024-06-01T08:01:05Z) - On Least Square Estimation in Softmax Gating Mixture of Experts [78.3687645289918]
決定論的MoEモデルに基づく最小二乗推定器(LSE)の性能について検討する。
我々は,多種多様な専門家関数の収束挙動を特徴付けるために,強い識別可能性という条件を確立する。
本研究は,専門家の選択に重要な意味を持つ。
論文 参考訳(メタデータ) (2024-02-05T12:31:18Z) - Specification-Guided Data Aggregation for Semantically Aware Imitation
Learning [11.104747861491703]
そこで本研究では,模倣学習モデルの改良手法を提案する。
可能な環境の空間を意味的に類似した領域に分割する手段として、正式な仕様セットを作成します。
次に、これらの特定領域の環境に関する専門家データを集約し、専門家の行動セマンティクスをより正確に模倣する。
論文 参考訳(メタデータ) (2023-03-29T20:29:26Z) - Partial Order in Chaos: Consensus on Feature Attributions in the
Rashomon Set [50.67431815647126]
ポストホックなグローバル/ローカルな特徴属性法は、機械学習モデルを理解するために徐々に採用されている。
この手法により局所的・言語的特徴の半順序が生じることを示す。
これらの部分的な順序に現れる特徴間の関係は、既存のアプローチによって提供されたランクにも当てはまることを示す。
論文 参考訳(メタデータ) (2021-10-26T02:53:14Z) - Latent Feature Representation via Unsupervised Learning for Pattern
Discovery in Massive Electron Microscopy Image Volumes [4.278591555984395]
特に,データセットにおける意味的類似性を捉える潜在表現を学ぶための教師なしのディープラーニングアプローチを提案する。
動物脳の比較的小さな部分でもテラバイトの画像を要求できるナノスケールの電子顕微鏡データに適用する手法の有用性を実証する。
論文 参考訳(メタデータ) (2020-12-22T17:14:19Z) - Towards an Automatic Analysis of CHO-K1 Suspension Growth in
Microfluidic Single-cell Cultivation [63.94623495501023]
我々は、人間の力で抽象化されたニューラルネットワークをデータレベルで注入できる新しい機械学習アーキテクチャを提案する。
具体的には、自然データと合成データに基づいて生成モデルを同時に訓練し、細胞数などの対象変数を確実に推定できる共有表現を学習する。
論文 参考訳(メタデータ) (2020-10-20T08:36:51Z) - Generalization Properties of Optimal Transport GANs with Latent
Distribution Learning [52.25145141639159]
本研究では,潜伏分布とプッシュフォワードマップの複雑さの相互作用が性能に与える影響について検討する。
我々の分析に感銘を受けて、我々はGANパラダイム内での潜伏分布とプッシュフォワードマップの学習を提唱した。
論文 参考訳(メタデータ) (2020-07-29T07:31:33Z) - Amortized Bayesian model comparison with evidential deep learning [0.12314765641075436]
本稿では,専門的なディープラーニングアーキテクチャを用いたベイズモデルの比較手法を提案する。
提案手法は純粋にシミュレーションベースであり,観測された各データセットに対して,すべての代替モデルを明示的に適合させるステップを回避している。
提案手法は,本研究で検討した事例に対して,精度,キャリブレーション,効率の点で優れた結果が得られることを示す。
論文 参考訳(メタデータ) (2020-04-22T15:15:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。