論文の概要: Optimizing Prognostic Biomarker Discovery in Pancreatic Cancer Through Hybrid Ensemble Feature Selection and Multi-Omics Data
- arxiv url: http://arxiv.org/abs/2509.02648v1
- Date: Tue, 02 Sep 2025 11:09:24 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-04 21:40:46.278764
- Title: Optimizing Prognostic Biomarker Discovery in Pancreatic Cancer Through Hybrid Ensemble Feature Selection and Multi-Omics Data
- Title(参考訳): 膵癌におけるハイブリット・アンサンブル・特徴選択とマルチオミクス・データによる診断的バイオマーカーの探索
- Authors: John Zobolas, Anne-Marie George, Alberto López, Sebastian Fischer, Marc Becker, Tero Aittokallio,
- Abstract要約: 高次元マルチオミクスデータを用いた患者の生存率の予測には,系統的特徴選択法が必要である。
我々は,データサブサンプリングと複数の予後モデルを組み合わせたハイブリッドアンサンブル特徴選択(hEFS)手法を開発した。
hEFSは従来のレイトフュージョンCoxLassoモデルに比べて著しく少ない、より安定したバイオマーカーを同定する。
- 参考スコア(独自算出の注目度): 4.010215468404495
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Prediction of patient survival using high-dimensional multi-omics data requires systematic feature selection methods that ensure predictive performance, sparsity, and reliability for prognostic biomarker discovery. We developed a hybrid ensemble feature selection (hEFS) approach that combines data subsampling with multiple prognostic models, integrating both embedded and wrapper-based strategies for survival prediction. Omics features are ranked using a voting-theory-inspired aggregation mechanism across models and subsamples, while the optimal number of features is selected via a Pareto front, balancing predictive accuracy and model sparsity without any user-defined thresholds. When applied to multi-omics datasets from three pancreatic cancer cohorts, hEFS identifies significantly fewer and more stable biomarkers compared to the conventional, late-fusion CoxLasso models, while maintaining comparable discrimination performance. Implemented within the open-source mlr3fselect R package, hEFS offers a robust, interpretable, and clinically valuable tool for prognostic modelling and biomarker discovery in high-dimensional survival settings.
- Abstract(参考訳): 高次元マルチオミクスデータを用いた患者の生存率の予測には, 予測性能, 空間性, 信頼性を保証できる系統的特徴選択法が必要である。
我々は,データサブサンプリングと複数の予後モデルを組み合わせたハイブリッドアンサンブル特徴選択(hEFS)手法を開発し,生存予測のための組込み戦略とラッパーベースの戦略を統合した。
オミクス機能は、モデルとサブサンプル間で投票理論にインスパイアされたアグリゲーションメカニズムを使用してランク付けされ、最適な数の機能はParetoフロントを介して選択され、ユーザ定義のしきい値なしで予測精度とモデルのスパーシリティのバランスをとる。
3つの膵癌コホートから得られたマルチオミクスデータセットに適用した場合、hEFSは従来のCoxLassoモデルに比べて著しく少ない、より安定したバイオマーカーを同定すると同時に、同等の識別性能を維持している。
オープンソースのmlr3fselect Rパッケージに実装されているhEFSは、高次元生存環境における予後モデリングとバイオマーカー発見のための堅牢で解釈可能な、臨床的に価値のあるツールを提供する。
関連論文リスト
- Deep Survival Analysis in Multimodal Medical Data: A Parametric and Probabilistic Approach with Competing Risks [47.19194118883552]
単一リスクシナリオと競合リスクシナリオの両方をモデル化可能な生存分析のためのマルチモーダルディープラーニングフレームワークを提案する。
生存予測のための新しいディープラーニングアーキテクチャであるSAMVAE(Survival Analysis Multimodal Variational Autoencoder)を提案する。
論文 参考訳(メタデータ) (2025-07-10T14:29:48Z) - Interpretable Graph Kolmogorov-Arnold Networks for Multi-Cancer Classification and Biomarker Identification using Multi-Omics Data [36.92842246372894]
Multi-Omics Graph Kolmogorov-Arnold Network (MOGKAN)は、メッセンジャーRNA、マイクロRNA配列、DNAメチル化サンプルを利用するディープラーニングフレームワークである。
グラフに基づく深層学習とマルチオミクスデータを統合することにより,提案手法は頑健な予測性能と解釈可能性を示す。
論文 参考訳(メタデータ) (2025-03-29T02:14:05Z) - GenBench: A Benchmarking Suite for Systematic Evaluation of Genomic Foundation Models [56.63218531256961]
我々はGenomic Foundation Modelsの有効性を評価するためのベンチマークスイートであるGenBenchを紹介する。
GenBenchはモジュラーで拡張可能なフレームワークを提供し、様々な最先端の方法論をカプセル化している。
本稿では,タスク固有性能におけるモデルアーキテクチャとデータセット特性の相互作用のニュアンス解析を行う。
論文 参考訳(メタデータ) (2024-06-01T08:01:05Z) - Exhaustive Exploitation of Nature-inspired Computation for Cancer Screening in an Ensemble Manner [20.07173196364489]
本研究では、遺伝子発現データからがん分類のためのアンサンブル学習を改善するために、進化最適化逆アンサンブル学習(EODE)と呼ばれるフレームワークを提案する。
各種癌種を含む35の遺伝子発現ベンチマークデータセットを対象に実験を行った。
論文 参考訳(メタデータ) (2024-04-06T08:07:48Z) - Ambiguous Medical Image Segmentation using Diffusion Models [60.378180265885945]
我々は,グループ洞察の分布を学習することで,複数の可算出力を生成する単一拡散モデルに基づくアプローチを提案する。
提案モデルでは,拡散の固有のサンプリングプロセスを利用してセグメンテーションマスクの分布を生成する。
その結果,提案手法は既存の最先端曖昧なセグメンテーションネットワークよりも優れていることがわかった。
論文 参考訳(メタデータ) (2023-04-10T17:58:22Z) - A robust kernel machine regression towards biomarker selection in
multi-omics datasets of osteoporosis for drug discovery [2.2897244874280043]
本稿では,ロバスト・カーネル・マシン・レグレッション(RobMR)を提案する。
実験により, 提案手法は骨粗しょう症の関連因子を効果的に同定することを示した。
提案手法は、利用可能なあらゆる疾患モデルマルチオミクスデータセットに適用できる。
論文 参考訳(メタデータ) (2022-01-13T16:39:46Z) - Cervical Cytology Classification Using PCA & GWO Enhanced Deep Features
Selection [1.990876596716716]
子宮頸癌は世界でも最も致命的かつ一般的な疾患の1つである。
ディープラーニングと特徴選択を利用した完全自動化フレームワークを提案する。
このフレームワークは3つの公開ベンチマークデータセットで評価されている。
論文 参考訳(メタデータ) (2021-06-09T08:57:22Z) - Bootstrapping Your Own Positive Sample: Contrastive Learning With
Electronic Health Record Data [62.29031007761901]
本稿では,新しいコントラスト型正規化臨床分類モデルを提案する。
EHRデータに特化した2つのユニークなポジティブサンプリング戦略を紹介します。
私たちのフレームワークは、現実世界のCOVID-19 EHRデータの死亡リスクを予測するために、競争の激しい実験結果をもたらします。
論文 参考訳(メタデータ) (2021-04-07T06:02:04Z) - G-MIND: An End-to-End Multimodal Imaging-Genetics Framework for
Biomarker Identification and Disease Classification [49.53651166356737]
診断によって誘導される画像データと遺伝データを統合し、解釈可能なバイオマーカーを提供する新しいディープニューラルネットワークアーキテクチャを提案する。
2つの機能的MRI(fMRI)パラダイムとSingle Nucleotide Polymorphism (SNP)データを含む統合失調症の集団研究で本モデルを評価した。
論文 参考訳(メタデータ) (2021-01-27T19:28:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。