論文の概要: HEMERA: A Human-Explainable Transformer Model for Estimating Lung Cancer Risk using GWAS Data
- arxiv url: http://arxiv.org/abs/2510.07477v1
- Date: Wed, 08 Oct 2025 19:23:32 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-10 17:54:14.689645
- Title: HEMERA: A Human-Explainable Transformer Model for Estimating Lung Cancer Risk using GWAS Data
- Title(参考訳): HEMERA:GWASデータを用いた肺癌リスク推定のためのヒト説明可能なトランスフォーマーモデル
- Authors: Maria Mahbub, Robert J. Klein, Myvizhi Esai Selvan, Rowena Yip, Claudia Henschke, Providencia Morales, Ian Goethert, Olivera Kotevska, Mayanka Chandra Shekar, Sean R. Wilkinson, Eileen McAllister, Samuel M. Aguayo, Zeynep H. Gümüş, Ioana Danciu, VA Million Veteran Program,
- Abstract要約: 肺がん (Lung cancer, LLC) は、アメリカ合衆国で3番目に多いがんであり、がん死の原因となっている。
遺伝子ワイド・アソシエーション研究(GWAS)によって同定された遺伝子バイオマーカーは、LCリスクを評価するための有望なツールである。
本稿では,単一ヌクレオチド多型(SNP)のGWASデータにトランスフォーマベースディープラーニングを応用し,LCリスクを予測する新しいフレームワークであるHEMERAを紹介する。
- 参考スコア(独自算出の注目度): 5.67448323642085
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Lung cancer (LC) is the third most common cancer and the leading cause of cancer deaths in the US. Although smoking is the primary risk factor, the occurrence of LC in never-smokers and familial aggregation studies highlight a genetic component. Genetic biomarkers identified through genome-wide association studies (GWAS) are promising tools for assessing LC risk. We introduce HEMERA (Human-Explainable Transformer Model for Estimating Lung Cancer Risk using GWAS Data), a new framework that applies explainable transformer-based deep learning to GWAS data of single nucleotide polymorphisms (SNPs) for predicting LC risk. Unlike prior approaches, HEMERA directly processes raw genotype data without clinical covariates, introducing additive positional encodings, neural genotype embeddings, and refined variant filtering. A post hoc explainability module based on Layer-wise Integrated Gradients enables attribution of model predictions to specific SNPs, aligning strongly with known LC risk loci. Trained on data from 27,254 Million Veteran Program participants, HEMERA achieved >99% AUC (area under receiver characteristics) score. These findings support transparent, hypothesis-generating models for personalized LC risk assessment and early intervention.
- Abstract(参考訳): 肺がん (Lung cancer, LLC) は、アメリカ合衆国で3番目に多いがんであり、がん死の原因となっている。
喫煙が主要なリスク要因であるが、喫煙者や家族の集合研究におけるLCの発生は遺伝学的要素を浮き彫りにしている。
遺伝子ワイド・アソシエーション研究(GWAS)によって同定された遺伝子バイオマーカーは、LCリスクを評価するための有望なツールである。
GWASデータを用いて肺がんリスクを推定するHEMERA(Human-Explainable Transformer Model for Estimating Lung Cancer Risk)を導入する。
従来のアプローチとは異なり、HEMERAは臨床共変量のない生の遺伝子型データを直接処理し、付加的な位置エンコーディング、神経ジェノタイプ埋め込み、洗練された変種フィルタリングを導入している。
Layer-wise Integrated Gradientsに基づくポストホック説明可能性モジュールは、特定のSNPへのモデル予測の帰属を可能にする。
27,254万人の退役軍人プログラム参加者からのデータに基づいて、HEMERAは99%のAUCスコアを得た。
これらの知見は、パーソナライズされたLCリスク評価と早期介入のための透過的仮説生成モデルを支持する。
関連論文リスト
- Reasoning Language Model for Personalized Lung Cancer Screening [10.241766336141685]
Lung CT Screening Reporting and Data System (Lung-RADS) は感度と特異性のトレードオフに直面している。
放射線診断と縦断的医療記録を統合した肺がんリスク評価のための推論言語モデル(RLM)を提案する。
論文 参考訳(メタデータ) (2025-09-07T18:38:39Z) - A Novel cVAE-Augmented Deep Learning Framework for Pan-Cancer RNA-Seq Classification [0.0]
本研究では,cVAE (class-conditional variational autoencoder) を用いて,パン・カンサー遺伝子発現分類のためのトレーニングデータを拡張する新しいディープラーニングフレームワークを提案する。
本稿では、VAEトレーニング曲線、性能指標(ROC曲線と混乱行列)、アーキテクチャ図など、詳細な実験結果を示す。
論文 参考訳(メタデータ) (2025-08-02T16:57:31Z) - PathGene: Benchmarking Driver Gene Mutations and Exon Prediction Using Multicenter Lung Cancer Histopathology Image Dataset [10.326278779332219]
肺癌における遺伝子変異、変異サブタイプおよびそれらのエクソンの正確な予測は、パーソナライズされた治療計画と予後評価に重要である。
病理組織像と次世代シークエンシングレポートを組み合わせたPathGeneを収集した。
このマルチセンターデータセットは、全スライディングイメージをドライバ遺伝子変異状態、突然変異サブタイプ、エキソン、腫瘍突然変異負担(TMB)ステータスにリンクする。
論文 参考訳(メタデータ) (2025-05-30T11:51:11Z) - Variational Autoencoders for Feature Exploration and Malignancy
Prediction of Lung Lesions [0.0]
肺がんはイギリスで21%のがん死の原因となっている。
最近の研究は、定期的なスキャンから肺がんの正確な早期診断のためのAI手法の能力を実証している。
本研究では, 変異型オートエンコーダ(VAE)の肺癌病変に対する応用について検討した。
論文 参考訳(メタデータ) (2023-11-27T11:12:33Z) - Pathology-and-genomics Multimodal Transformer for Survival Outcome
Prediction [43.1748594898772]
大腸癌生存予測に病理学とゲノム学的知見を統合したマルチモーダルトランスフォーマー(PathOmics)を提案する。
ギガピクセル全スライド画像における組織ミクロ環境間の内在的相互作用を捉えるための教師なし事前訓練を強調した。
我々は,TCGA大腸癌と直腸癌コホートの両方に対するアプローチを評価し,提案手法は競争力があり,最先端の研究より優れていることを示す。
論文 参考訳(メタデータ) (2023-07-22T00:59:26Z) - Penalized Deep Partially Linear Cox Models with Application to CT Scans
of Lung Cancer Patients [42.09584755334577]
肺がんは世界中のがん死亡の原因であり、効果的な治療法を設計するための死亡リスクを理解することの重要性を強調している。
NLST(National Lung Screening Trial)は、肺がん患者の死亡リスクを定量化するために、CTテクスチャ解析を用いている。
本稿では,SCADペナルティを組み込んで重要なテクスチャ特徴を抽出し,深層ニューラルネットワークを用いてモデルの非パラメトリック成分を推定する,Pentalized Deep partially Linear Cox Model (Penalized DPLC)を提案する。
論文 参考訳(メタデータ) (2023-03-09T15:38:16Z) - Machine Learning Methods for Cancer Classification Using Gene Expression
Data: A Review [77.34726150561087]
がんは心臓血管疾患の2番目の死因である。
遺伝子発現は癌の早期発見において基本的な役割を担っている。
本研究は,機械学習を用いた癌分類における遺伝子発現解析の最近の進歩を概説する。
論文 参考訳(メタデータ) (2023-01-28T15:03:03Z) - CAE-Transformer: Transformer-based Model to Predict Invasiveness of Lung
Adenocarcinoma Subsolid Nodules from Non-thin Section 3D CT Scans [36.093580055848186]
肺腺癌(LAUC)は近年最も多い疾患である。
肺結節の侵襲性に関するタイムリーかつ正確な知識は適切な治療計画をもたらし、不必要な手術や遅発手術のリスクを低減させる。
LAUCの浸潤度を評価し,予測するための主要な画像モダリティは胸部CTである。
本稿では、LAUCを分類するために、予測トランスフォーマーベースのフレームワーク「CAE-Transformer」を開発した。
論文 参考訳(メタデータ) (2021-10-17T04:37:24Z) - Low-Rank Reorganization via Proportional Hazards Non-negative Matrix
Factorization Unveils Survival Associated Gene Clusters [9.773075235189525]
この研究において、Cox比例ハザードの回帰は生存制約を課すことでNMFと統合される。
ヒト癌遺伝子の発現データを用いて、提案手法は癌遺伝子の重要なクラスターを解明することができる。
発見された遺伝子クラスターは、豊富な生物学的含意を反映し、生存に関連するバイオマーカーの同定に役立つ。
論文 参考訳(メタデータ) (2020-08-09T17:59:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。