論文の概要: A Machine Learning Pipeline for Multiple Sclerosis Biomarker Discovery: Comparing explainable AI and Traditional Statistical Approaches
- arxiv url: http://arxiv.org/abs/2509.22484v1
- Date: Fri, 26 Sep 2025 15:31:34 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-29 20:57:54.550149
- Title: A Machine Learning Pipeline for Multiple Sclerosis Biomarker Discovery: Comparing explainable AI and Traditional Statistical Approaches
- Title(参考訳): 多発性硬化症のバイオマーカー発見のための機械学習パイプライン:説明可能なAIと従来の統計的アプローチの比較
- Authors: Samuele Punzo, Silvia Giulia Galfrè, Francesco Massafra, Alessandro Maglione, Corrado Priami, Alina Sîrbu,
- Abstract要約: 多発性硬化症(MS)におけるバイオマーカー発見のための機械学習パイプラインを提案する。
頑健な前処理の後、ベイズ探索により最適化されたXGBoost分類器を訓練した。
以上の結果より,SHAPとDEAの重なり合いと特異なバイオマーカーの両者が明らかとなり,相補的強度が示唆された。
この研究は、説明可能なAI(xAI)と従来の統計手法を組み合わせることの価値を強調し、疾患のメカニズムについて深い洞察を得る。
- 参考スコア(独自算出の注目度): 35.18016233072556
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We present a machine learning pipeline for biomarker discovery in Multiple Sclerosis (MS), integrating eight publicly available microarray datasets from Peripheral Blood Mononuclear Cells (PBMC). After robust preprocessing we trained an XGBoost classifier optimized via Bayesian search. SHapley Additive exPlanations (SHAP) were used to identify key features for model prediction, indicating thus possible biomarkers. These were compared with genes identified through classical Differential Expression Analysis (DEA). Our comparison revealed both overlapping and unique biomarkers between SHAP and DEA, suggesting complementary strengths. Enrichment analysis confirmed the biological relevance of SHAP-selected genes, linking them to pathways such as sphingolipid signaling, Th1/Th2/Th17 cell differentiation, and Epstein-Barr virus infection all known to be associated with MS. This study highlights the value of combining explainable AI (xAI) with traditional statistical methods to gain deeper insights into disease mechanism.
- Abstract(参考訳): 末梢血単核細胞(PBMC)からの8つのマイクロアレイデータセットを統合した,多発性硬化症(MS)におけるバイオマーカー発見のための機械学習パイプラインを提案する。
頑健な前処理の後、ベイズ探索により最適化されたXGBoost分類器を訓練した。
SHAP (SHapley Additive exPlanations) はモデル予測の鍵となる特徴を同定するために用いられる。
これらは古典的微分表現解析(DEA)で同定された遺伝子と比較された。
以上の結果より,SHAPとDEAの重なり合いと特異なバイオマーカーの両者が明らかとなり,相補的強度が示唆された。
エンリッチメント分析により、SHAP選択された遺伝子の生物学的関連性が確認され、スフィンゴ脂質シグナル、Th1/Th2/Th17細胞分化、Epstein-Barrウイルス感染症などの経路にリンクされている。本研究では、説明可能なAI(xAI)と従来の統計手法を組み合わせることで、疾患のメカニズムに関する深い知見を得ることができる。
関連論文リスト
- An Interpretable Ensemble Framework for Multi-Omics Dementia Biomarker Discovery Under HDLSS Conditions [0.0]
本稿では、グラフ注意ネットワーク(GAT)、マルチOmics Variational AutoEncoder(MOVE)、Elastic-net sparse regression、Storey's False Discovery Rate(FDR)を組み合わせた新しいアンサンブル手法を提案する。
シミュレーションされたマルチオミクスデータとアルツハイマー病神経画像イニシアチブ(ADNI)データセットを用いて評価を行った。
本手法は, 優れた予測精度, 特徴選択精度, 生物学的妥当性を示す。
論文 参考訳(メタデータ) (2025-09-04T15:20:13Z) - Interpretable Graph Kolmogorov-Arnold Networks for Multi-Cancer Classification and Biomarker Identification using Multi-Omics Data [36.92842246372894]
Multi-Omics Graph Kolmogorov-Arnold Network (MOGKAN)は、メッセンジャーRNA、マイクロRNA配列、DNAメチル化サンプルを利用するディープラーニングフレームワークである。
グラフに基づく深層学習とマルチオミクスデータを統合することにより,提案手法は頑健な予測性能と解釈可能性を示す。
論文 参考訳(メタデータ) (2025-03-29T02:14:05Z) - Causal Representation Learning from Multimodal Biomedical Observations [57.00712157758845]
バイオメディカルデータセットの理解を容易にするために,マルチモーダルデータに対するフレキシブルな識別条件と原理的手法を開発した。
主要な理論的貢献は、モジュラリティ間の因果関係の構造的空間性である。
実世界のヒト表現型データセットの結果は、確立された生物医学研究と一致している。
論文 参考訳(メタデータ) (2024-11-10T16:40:27Z) - Prompting Whole Slide Image Based Genetic Biomarker Prediction [13.764676578911526]
本稿では,全スライド画像(WSI)に基づく遺伝的バイオマーカー予測手法を提案する。
我々は、大きな言語モデルを利用して、遺伝バイオマーカーに関連する事例を抽出する際、先行知識となる医学的プロンプトを生成する。
腫瘍微小環境におけるバイオマーカー情報のマイニングには粗大なアプローチを採用する。
論文 参考訳(メタデータ) (2024-06-26T11:05:46Z) - scBeacon: single-cell biomarker extraction via identifying paired cell
clusters across biological conditions with contrastive siamese networks [0.9591674293850556]
scBeaconは、深いコントラストのあるシアムネットワーク上に構築されたフレームワークである。
scBeaconは、様々な条件で一致した細胞集団を特定します。
包括的な評価は、既存の単細胞差分遺伝子解析ツールよりも scBeacon の方が優れていることを検証する。
論文 参考訳(メタデータ) (2023-11-05T08:27:24Z) - Tertiary Lymphoid Structures Generation through Graph-based Diffusion [54.37503714313661]
本研究では,最先端のグラフベース拡散モデルを用いて生物学的に意味のある細胞グラフを生成する。
本研究では, グラフ拡散モデルを用いて, 3次リンパ構造(TLS)の分布を正確に学習できることを示す。
論文 参考訳(メタデータ) (2023-10-10T14:37:17Z) - Unsupervised ensemble-based phenotyping helps enhance the
discoverability of genes related to heart morphology [57.25098075813054]
我々はUn Phenotype Ensemblesという名の遺伝子発見のための新しいフレームワークを提案する。
教師なしの方法で学習された表現型のセットをプールすることで、冗長だが非常に表現性の高い表現を構築する。
これらの表現型は、(GWAS)を介して分析され、高い自信と安定した関連のみを保持する。
論文 参考訳(メタデータ) (2023-01-07T18:36:44Z) - G-MIND: An End-to-End Multimodal Imaging-Genetics Framework for
Biomarker Identification and Disease Classification [49.53651166356737]
診断によって誘導される画像データと遺伝データを統合し、解釈可能なバイオマーカーを提供する新しいディープニューラルネットワークアーキテクチャを提案する。
2つの機能的MRI(fMRI)パラダイムとSingle Nucleotide Polymorphism (SNP)データを含む統合失調症の集団研究で本モデルを評価した。
論文 参考訳(メタデータ) (2021-01-27T19:28:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。