論文の概要: DCMD: Distance-based Classification Using Mixture Distributions on
Microbiome Data
- arxiv url: http://arxiv.org/abs/2003.13161v1
- Date: Sun, 29 Mar 2020 23:30:20 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-18 14:05:17.838492
- Title: DCMD: Distance-based Classification Using Mixture Distributions on
Microbiome Data
- Title(参考訳): DCMD:マイクロバイオームデータの混合分布を用いた距離に基づく分類
- Authors: Konstantin Shestopaloff, Mei Dong, Fan Gao, Wei Xu
- Abstract要約: 混合分布(DCMD)を用いた距離ベース分類のための革新的な手法を提案する。
このアプローチはサンプルデータの混合分布を推定することによりスパース数に固有の不確実性をモデル化する。
結果は、既存の機械学習や距離ベースのアプローチと比較される。
- 参考スコア(独自算出の注目度): 10.171660468645603
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Current advances in next generation sequencing techniques have allowed
researchers to conduct comprehensive research on microbiome and human diseases,
with recent studies identifying associations between human microbiome and
health outcomes for a number of chronic conditions. However, microbiome data
structure, characterized by sparsity and skewness, presents challenges to
building effective classifiers. To address this, we present an innovative
approach for distance-based classification using mixture distributions (DCMD).
The method aims to improve classification performance when using microbiome
community data, where the predictors are composed of sparse and heterogeneous
count data. This approach models the inherent uncertainty in sparse counts by
estimating a mixture distribution for the sample data, and representing each
observation as a distribution, conditional on observed counts and the estimated
mixture, which are then used as inputs for distance-based classification. The
method is implemented into a k-means and k-nearest neighbours framework and we
identify two distance metrics that produce optimal results. The performance of
the model is assessed using simulations and applied to a human microbiome
study, with results compared against a number of existing machine learning and
distance-based approaches. The proposed method is competitive when compared to
the machine learning approaches and showed a clear improvement over commonly
used distance-based classifiers. The range of applicability and robustness make
the proposed method a viable alternative for classification using sparse
microbiome count data.
- Abstract(参考訳): 次世代シークエンシング技術の最近の進歩により、研究者は微生物とヒトの病気に関する包括的な研究を行うことができ、最近の研究では、慢性疾患におけるヒトのマイクロバイオームと健康状態との関連が特定されている。
しかし, マイクロバイオームデータ構造は, スパーシティとスキューネスを特徴とし, 効果的な分類器の構築に課題がある。
そこで本研究では,混合分布(DCMD)を用いた距離に基づく分類手法を提案する。
本手法は,マイクロバイオーム群集データを用いた分類性能の向上を目的としている。
提案手法は,サンプルデータの混合分布を推定し,各観測結果を分布として,観測回数の条件と推定混合物として表現することにより,スパース数に固有の不確実性をモデル化する。
本手法は, k-means および k-nearest 近傍のフレームワークに実装され, 最適結果をもたらす2つの距離指標を同定する。
モデルの性能をシミュレーションを用いて評価し、ヒトのマイクロバイオーム研究に適用し、既存の機械学習や距離に基づくアプローチと比較した。
提案手法は,機械学習手法と比較して競争力があり,一般的な距離ベース分類器よりも明らかに改善されている。
適用性と堅牢性の範囲は, スパースマイクロバイオームカウントデータを用いた分類法として有効な方法である。
関連論文リスト
- Pretrained-Guided Conditional Diffusion Models for Microbiome Data Analysis [1.433758865948252]
マイクロバイオームデータ計算と復調のための新しい訓練済み条件拡散モデルmbVDiTを紹介する。
原因不明のデータと患者のメタデータを条件付きガイダンスとして使用し、欠落した値を計算します。
また、VAEを使用して他の公開マイクロバイオームデータセットを統合し、モデルパフォーマンスを向上させる。
論文 参考訳(メタデータ) (2024-08-10T01:54:06Z) - Collaborative Heterogeneous Causal Inference Beyond Meta-analysis [68.4474531911361]
異種データを用いた因果推論のための協調的逆確率スコア推定器を提案する。
異質性の増加に伴うメタアナリシスに基づく手法に対して,本手法は有意な改善を示した。
論文 参考訳(メタデータ) (2024-04-24T09:04:36Z) - Seeing Unseen: Discover Novel Biomedical Concepts via
Geometry-Constrained Probabilistic Modeling [53.7117640028211]
同定された問題を解決するために,幾何制約付き確率的モデリング処理を提案する。
構成された埋め込み空間のレイアウトに適切な制約を課すために、重要な幾何学的性質のスイートを組み込む。
スペクトルグラフ理論法は、潜在的な新規クラスの数を推定するために考案された。
論文 参考訳(メタデータ) (2024-03-02T00:56:05Z) - Cross-Validation for Training and Testing Co-occurrence Network
Inference Algorithms [1.8638865257327277]
共起ネットワーク推論アルゴリズムは、微生物、特にバクテリアの複雑な関連を理解するのに役立ちます。
推定されたネットワークの品質を評価するための従来の方法は、外部データの使用、サブサンプル間のネットワーク一貫性などである。
本稿では、共起ネットワーク推論アルゴリズムを評価するための新しいクロスバリデーション手法と、テストデータに基づく予測に既存のアルゴリズムを適用する新しい方法を提案する。
論文 参考訳(メタデータ) (2023-09-26T19:43:15Z) - A One-shot Framework for Distributed Clustered Learning in Heterogeneous
Environments [54.172993875654015]
異種環境における分散学習のためのコミュニケーション効率化手法のファミリーを提案する。
ユーザによるローカル計算に基づくワンショットアプローチと、サーバにおけるクラスタリングベースのアグリゲーションステップは、強力な学習保証を提供する。
厳密な凸問題に対しては,ユーザ毎のデータ点数がしきい値を超える限り,提案手法はサンプルサイズの観点から順序最適平均二乗誤差率を達成する。
論文 参考訳(メタデータ) (2022-09-22T09:04:10Z) - Scalable Intervention Target Estimation in Linear Models [52.60799340056917]
因果構造学習への現在のアプローチは、既知の介入目標を扱うか、仮説テストを使用して未知の介入目標を発見する。
本稿では、全ての介入対象を一貫して識別するスケーラブルで効率的なアルゴリズムを提案する。
提案アルゴリズムは、与えられた観測マルコフ同値クラスを介入マルコフ同値クラスに更新することも可能である。
論文 参考訳(メタデータ) (2021-11-15T03:16:56Z) - Bootstrapping Your Own Positive Sample: Contrastive Learning With
Electronic Health Record Data [62.29031007761901]
本稿では,新しいコントラスト型正規化臨床分類モデルを提案する。
EHRデータに特化した2つのユニークなポジティブサンプリング戦略を紹介します。
私たちのフレームワークは、現実世界のCOVID-19 EHRデータの死亡リスクを予測するために、競争の激しい実験結果をもたらします。
論文 参考訳(メタデータ) (2021-04-07T06:02:04Z) - Latent Network Estimation and Variable Selection for Compositional Data
via Variational EM [0.0]
ネットワークの相互作用と関連性を同時に推定する新しい手法を開発した。
マイクロバイオームデータへの応用を通して,本モデルの実用性を示す。
論文 参考訳(メタデータ) (2020-10-25T21:52:39Z) - Mycorrhiza: Genotype Assignment usingPhylogenetic Networks [2.286041284499166]
遺伝子型代入問題に対する機械学習手法であるMycorrhizaを紹介する。
提案アルゴリズムは系統ネットワークを用いて,標本間の進化的関係を符号化する特徴を設計する。
Mycorrhizaは、大きな平均固定指数(FST)を持つデータセットやハーディ・ワインバーグ平衡からの偏差で特に顕著な利得を得る。
論文 参考訳(メタデータ) (2020-10-14T02:36:27Z) - Neural Estimators for Conditional Mutual Information Using Nearest
Neighbors Sampling [36.35382677479192]
サンプルの集合から相互情報(MI)または条件相互情報(CMI)を推定することは、長年の課題である。
最近の研究は、ニューラルネットワークの近似能力を活用し、従来の手法よりも改善されている。
サンプル平均値に高信頼濃度境界を導出し, 再サンプリングを行うため, k 隣人 (k-NN) に基づく新しい手法を提案する。
論文 参考訳(メタデータ) (2020-06-12T14:30:45Z) - Predictive Modeling of ICU Healthcare-Associated Infections from
Imbalanced Data. Using Ensembles and a Clustering-Based Undersampling
Approach [55.41644538483948]
本研究は,集中治療室における危険因子の同定と医療関連感染症の予測に焦点をあてる。
感染発生率の低減に向けた意思決定を支援することを目的とする。
論文 参考訳(メタデータ) (2020-05-07T16:13:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。