論文の概要: Prostate-VarBench: A Benchmark with Interpretable TabNet Framework for Prostate Cancer Variant Classification
- arxiv url: http://arxiv.org/abs/2511.09576v1
- Date: Fri, 14 Nov 2025 01:00:33 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-14 22:53:22.339072
- Title: Prostate-VarBench: A Benchmark with Interpretable TabNet Framework for Prostate Cancer Variant Classification
- Title(参考訳): Prostate-VarBench:前立腺癌変数分類のための解釈可能なTabNetフレームワークを用いたベンチマーク
- Authors: Abraham Francisco Arellano Tavara, Umesh Kumar, Jathurshan Pradeepkumar, Jimeng Sun,
- Abstract要約: VUS(Variants of Uncertain Significance)は前立腺癌ゲノムの臨床的有用性を制限する。
Prostate-VarBenchは、prostate固有のベンチマークを作成するための、キュレートされたパイプラインである。
- 参考スコア(独自算出の注目度): 14.190646211771073
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Variants of Uncertain Significance (VUS) limit the clinical utility of prostate cancer genomics by delaying diagnosis and therapy when evidence for pathogenicity or benignity is incomplete. Progress is further limited by inconsistent annotations across sources and the absence of a prostate-specific benchmark for fair comparison. We introduce Prostate-VarBench, a curated pipeline for creating prostate-specific benchmarks that integrates COSMIC (somatic cancer mutations), ClinVar (expert-curated clinical variants), and TCGA-PRAD (prostate tumor genomics from The Cancer Genome Atlas) into a harmonized dataset of 193,278 variants supporting patient- or gene-aware splits to prevent data leakage. To ensure data integrity, we corrected a Variant Effect Predictor (VEP) issue that merged multiple transcript records, introducing ambiguity in clinical significance fields. We then standardized 56 interpretable features across eight clinically relevant tiers, including population frequency, variant type, and clinical context. AlphaMissense pathogenicity scores were incorporated to enhance missense variant classification and reduce VUS uncertainty. Building on this resource, we trained an interpretable TabNet model to classify variant pathogenicity, whose step-wise sparse masks provide per-case rationales consistent with molecular tumor board review practices. On the held-out test set, the model achieved 89.9% accuracy with balanced class metrics, and the VEP correction yields an 6.5% absolute reduction in VUS.
- Abstract(参考訳): VUS(Variants of Uncertain Significance)は、病原性や良性を示す証拠が不完全である場合に、診断と治療を遅らせることによって前立腺癌ゲノムの臨床的有用性を制限する。
プログレスはさらに、ソース間の一貫性のないアノテーションと、公正な比較のための前立腺特異的ベンチマークがないことで制限されている。
これはCOSMIC(体細胞癌変異)、ClinVar(精巧な臨床変異)、TCGA-PRAD(The Cancer Genome Atlasによる前立腺腫瘍ゲノム学)を統合した前立腺特異的ベンチマークを作成するためのキュレートパイプラインである。
データ整合性を確保するため,複数の転写記録を融合したVEP(Variant Effect Predictor)問題を修正し,臨床的意義分野の曖昧さを導入した。
次に, 集団頻度, 変異型, 臨床コンテキストを含む, 8つの臨床関連層で56の解釈可能な特徴を標準化した。
AlphaMissense病原性スコアは、ミスセンス変種分類を強化し、VUSの不確実性を低減するために組み込まれた。
この資源を基盤として,分子腫瘍レビューの実践と整合したステップワイズマスクを用いた解釈可能なTabNetモデルを構築した。
保持されたテストセットでは、モデルの精度は89.9%に達し、VEP補正はVUSの6.5%の絶対的な減少をもたらす。
関連論文リスト
- Assessing the Feasibility of Early Cancer Detection Using Routine Laboratory Data: An Evaluation of Machine Learning Approaches on an Imbalanced Dataset [0.02030567625639093]
犬における早期がん検出のためのアクセス可能なスクリーニングツールの開発は、獣医学における重要な課題である。
本研究は,Golden Retriever Lifetime Studyコホートを用いたがんリスク分類の可能性を評価する。
通常の検査データには統計的に検出可能ながんシグナルが存在するが、正常な老化やその他の炎症状態から臨床的に信頼性の高い識別を行うには弱く、確立されていないと結論付けている。
論文 参考訳(メタデータ) (2025-10-23T04:52:42Z) - Transformer Classification of Breast Lesions: The BreastDCEDL_AMBL Benchmark Dataset and 0.92 AUC Baseline [1.9336815376402718]
本研究では,ダイナミックコントラスト強調MRIにおける乳腺病変の自動分類のためのトランスフォーマーベースフレームワークを提案する。
患者レベルでは100%の感度と67%の特異性を有する病変レベル分類のAUCを0.92で達成したSegFormerアーキテクチャを実装した。
データセット、モデル、評価プロトコルの公開リリースは、DCE-MRI病変分類のための最初の標準化されたベンチマークを提供する。
論文 参考訳(メタデータ) (2025-09-30T15:58:02Z) - Fast TILs -- A Pipeline for Efficient TILs Estimation in Non-Small Cell Lung Cancer [0.0]
非小細胞肺癌(NSCLC)における腫瘍浸潤リンパ球(TIL)の定量化には大きな課題がある。
本研究は,半確率的パッチサンプリングとパッチ分類を用いて,予後関連パッチを保持する自動パイプラインを提案する。
パイプラインは、予後に関係のない領域の約70%を効率よく排除し、予後の正確性を維持するために残りのパッチの5%しか必要としない。
論文 参考訳(メタデータ) (2024-05-05T12:41:55Z) - Using Pre-training and Interaction Modeling for ancestry-specific disease prediction in UK Biobank [69.90493129893112]
近年のゲノムワイド・アソシエーション(GWAS)研究は、複雑な形質の遺伝的基盤を明らかにしているが、非ヨーロッパ系個体の低発現を示している。
そこで本研究では,マルチオミクスデータを用いて,多様な祖先間での疾患予測を改善することができるかを評価する。
論文 参考訳(メタデータ) (2024-04-26T16:39:50Z) - Towards Reliable Medical Image Segmentation by Modeling Evidential Calibrated Uncertainty [57.023423137202485]
医用画像のセグメンテーションの信頼性に関する懸念が臨床医の間で続いている。
本稿では,医療画像セグメンテーションネットワークにシームレスに統合可能な,実装が容易な基礎モデルであるDEviSを紹介する。
主観的論理理論を活用することで、医用画像分割の確率と不確実性を明示的にモデル化する。
論文 参考訳(メタデータ) (2023-01-01T05:02:46Z) - Cancer Gene Profiling through Unsupervised Discovery [49.28556294619424]
低次元遺伝子バイオマーカーを発見するための,新しい,自動かつ教師なしのフレームワークを提案する。
本手法は,高次元中心型非監視クラスタリングアルゴリズムLP-Stabilityアルゴリズムに基づく。
私達の署名は免疫炎症および免疫砂漠の腫瘍の区別の有望な結果報告します。
論文 参考訳(メタデータ) (2021-02-11T09:04:45Z) - Increasing the efficiency of randomized trial estimates via linear
adjustment for a prognostic score [59.75318183140857]
ランダム化実験による因果効果の推定は臨床研究の中心である。
歴史的借用法のほとんどは、厳格なタイプiエラー率制御を犠牲にして分散の削減を達成する。
論文 参考訳(メタデータ) (2020-12-17T21:10:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。