論文の概要: DepMicroDiff: Diffusion-Based Dependency-Aware Multimodal Imputation for Microbiome Data
- arxiv url: http://arxiv.org/abs/2507.23676v1
- Date: Thu, 31 Jul 2025 15:51:41 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-01 17:19:10.109633
- Title: DepMicroDiff: Diffusion-Based Dependency-Aware Multimodal Imputation for Microbiome Data
- Title(参考訳): DepMicroDiff:マイクロバイオームデータのための拡散依存型マルチモーダルインパテーション
- Authors: Rabeya Tus Sadia, Qiang Cheng,
- Abstract要約: DepMicroDiffは、微生物の分類とコンテキストメタデータの間の複雑な相互依存性をキャプチャーする新しいフレームワークである。
最先端のベースラインを大幅に上回り、ピアソン相関(最大0.712)、コサイン類似性(最大0.812)、複数のがんタイプでRMSEとMAEが低い。
- 参考スコア(独自算出の注目度): 13.110156202816112
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Microbiome data analysis is essential for understanding host health and disease, yet its inherent sparsity and noise pose major challenges for accurate imputation, hindering downstream tasks such as biomarker discovery. Existing imputation methods, including recent diffusion-based models, often fail to capture the complex interdependencies between microbial taxa and overlook contextual metadata that can inform imputation. We introduce DepMicroDiff, a novel framework that combines diffusion-based generative modeling with a Dependency-Aware Transformer (DAT) to explicitly capture both mutual pairwise dependencies and autoregressive relationships. DepMicroDiff is further enhanced by VAE-based pretraining across diverse cancer datasets and conditioning on patient metadata encoded via a large language model (LLM). Experiments on TCGA microbiome datasets show that DepMicroDiff substantially outperforms state-of-the-art baselines, achieving higher Pearson correlation (up to 0.712), cosine similarity (up to 0.812), and lower RMSE and MAE across multiple cancer types, demonstrating its robustness and generalizability for microbiome imputation.
- Abstract(参考訳): 微生物データ分析は宿主の健康と病気を理解するのに不可欠であるが、その固有の空間とノイズは正確な計算のために大きな課題となり、バイオマーカー発見のような下流のタスクを妨げている。
最近の拡散モデルを含む既存の計算手法は、しばしば、微生物の分類と、予測できない文脈メタデータの間の複雑な相互依存を捉えない。
DAT(Dependency-Aware Transformer)と拡散に基づく生成モデリングを組み合わせた新しいフレームワークであるDepMicroDiffを導入する。
DepMicroDiffは、様々ながんデータセットにまたがるVAEベースの事前トレーニングと、大きな言語モデル(LLM)でエンコードされた患者のメタデータの条件付けにより、さらに強化されている。
TCGAマイクロバイオームデータセットの実験では、DepMicroDiffは最先端のベースラインを大幅に上回り、ピアソン相関(最大0.712まで)、コサイン類似性(最大0.812まで)、複数のがんタイプにわたるRMSEとMAEの低い類似性を達成し、マイクロバイオームインプットの堅牢性と一般化性を実証している。
関連論文リスト
- PolSAM: Polarimetric Scattering Mechanism Informed Segment Anything Model [76.95536611263356]
PolSARデータは、そのリッチで複雑な特徴のために、ユニークな課題を提示する。
複素数値データ、偏光特性、振幅画像などの既存のデータ表現が広く使われている。
PolSARのほとんどの機能抽出ネットワークは小さく、機能を効果的にキャプチャする能力を制限している。
本稿では,ドメイン固有の散乱特性と新規なプロンプト生成戦略を統合したSegment Anything Model (SAM) であるPolarimetric Scattering Mechanism-Informed SAM (PolSAM)を提案する。
論文 参考訳(メタデータ) (2024-12-17T09:59:53Z) - Pretrained-Guided Conditional Diffusion Models for Microbiome Data Analysis [1.433758865948252]
マイクロバイオームデータ計算と復調のための新しい訓練済み条件拡散モデルmbVDiTを紹介する。
原因不明のデータと患者のメタデータを条件付きガイダンスとして使用し、欠落した値を計算します。
また、VAEを使用して他の公開マイクロバイオームデータセットを統合し、モデルパフォーマンスを向上させる。
論文 参考訳(メタデータ) (2024-08-10T01:54:06Z) - DiffPuter: Empowering Diffusion Models for Missing Data Imputation [56.48119008663155]
本稿ではDiffPuterについて紹介する。DiffPuterは、データ計算の欠如に対する期待最大化(EM)アルゴリズムと組み合わせた、カスタマイズされた拡散モデルである。
我々の理論的解析は、DiffPuterのトレーニングステップがデータ密度の最大推定値に対応することを示している。
DiffPuterは,最も競争力のある既存手法と比較して,MAEが6.94%,RMSEが4.78%向上した。
論文 参考訳(メタデータ) (2024-05-31T08:35:56Z) - FORESEE: Multimodal and Multi-view Representation Learning for Robust Prediction of Cancer Survival [3.4686401890974197]
マルチモーダル情報のマイニングにより患者生存を確実に予測する新しいエンドツーエンドフレームワークFOESEEを提案する。
クロスフュージョントランスフォーマーは、細胞レベル、組織レベル、腫瘍の不均一度レベルの特徴を効果的に利用し、予後を相関させる。
ハイブリットアテンションエンコーダ(HAE)は、コンテキストアテンションモジュールを用いて、コンテキスト関係の特徴を取得する。
また、モダリティ内の損失情報を再構成する非対称マスク型3重マスク型オートエンコーダを提案する。
論文 参考訳(メタデータ) (2024-05-13T12:39:08Z) - DF-DM: A foundational process model for multimodal data fusion in the artificial intelligence era [3.2549142515720044]
本稿では,データマイニングのためのマルチモーダルデータフュージョンの新しいプロセスモデルを提案する。
我々のモデルは、効率と信頼性を改善しつつ、計算コスト、複雑さ、バイアスを減らすことを目的としている。
本研究は,糖尿病網膜症における網膜画像と患者のメタデータを用いた予測,衛星画像を用いた家庭内暴力予測,インターネット,国勢調査データ,放射線画像と臨床ノートによる臨床像と人口動態の同定という3つのユースケースを通じて有効性を示す。
論文 参考訳(メタデータ) (2024-04-18T15:52:42Z) - Multi-Modal Federated Learning for Cancer Staging over Non-IID Datasets with Unbalanced Modalities [9.476402318365446]
本研究では,データサンプルの不均一性だけでなく,機関間のデータモダリティの固有不均一性と不均一性を両立する新しいFLアーキテクチャを提案する。
マルチモーダルFLに適した分散勾配ブレンディングと近接対応クライアント重み付け戦略を考案した。
論文 参考訳(メタデータ) (2024-01-07T23:45:01Z) - Convolutional Monge Mapping Normalization for learning on sleep data [63.22081662149488]
我々は、CMMN(Convolutional Monge Mapping Normalization)と呼ばれる新しい手法を提案する。
CMMNは、そのパワースペクトル密度(PSD)をトレーニングデータに基づいて推定されるワッサーシュタインバリセンタに適応させるために、信号をフィルタリングする。
睡眠脳波データに関する数値実験により、CMMNはニューラルネットワークアーキテクチャから独立して、顕著で一貫したパフォーマンス向上をもたらすことが示された。
論文 参考訳(メタデータ) (2023-05-30T08:24:01Z) - Deep neural networks approach to microbial colony detection -- a
comparative analysis [52.77024349608834]
本稿では,AGARデータセットを用いた3つの深層学習手法の性能について検討する。
得られた結果は将来の実験のベンチマークとして機能するかもしれない。
論文 参考訳(メタデータ) (2021-08-23T12:06:00Z) - Federated Deep AUC Maximization for Heterogeneous Data with a Constant
Communication Complexity [77.78624443410216]
異種胸部データ検出のための改良型FDAMアルゴリズムを提案する。
本研究は,提案アルゴリズムの通信が機械数に強く依存し,精度レベルにも強く依存していることを示す。
FDAMアルゴリズムのベンチマークデータセットと、異なる組織の医療用胸部X線画像に対する効果を実験により実証した。
論文 参考訳(メタデータ) (2021-02-09T04:05:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。