論文の概要: Predicting EGFR Mutation in LUAD from Histopathological Whole-Slide Images Using Pretrained Foundation Model and Transfer Learning: An Indian Cohort Study
- arxiv url: http://arxiv.org/abs/2508.01352v1
- Date: Sat, 02 Aug 2025 12:57:16 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-05 18:25:21.839379
- Title: Predicting EGFR Mutation in LUAD from Histopathological Whole-Slide Images Using Pretrained Foundation Model and Transfer Learning: An Indian Cohort Study
- Title(参考訳): 保存的基礎モデルと移動学習を用いた病理組織学的全スライディング画像からのLUADのEGFR変異予測 : インドコホート研究
- Authors: Sagar Singh Gwal, Rajan, Suyash Devgan, Shraddhanjali Satapathy, Abhishek Goyal, Nuruddin Mohammad Iqbal, Vivaan Jain, Prabhat Singh Mallik, Deepali Jain, Ishaan Gupta,
- Abstract要約: 肺腺癌 (LUAD) は非小細胞肺癌(NSCLC)の亜型である
EGFR遺伝子変異を有するLUADは、LUAD症例の約46%を占める。
AIモデルの最近の進歩は、がんの検出と分類において有望な結果を示している。
- 参考スコア(独自算出の注目度): 1.0442511738376665
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Lung adenocarcinoma (LUAD) is a subtype of non-small cell lung cancer (NSCLC). LUAD with mutation in the EGFR gene accounts for approximately 46% of LUAD cases. Patients carrying EGFR mutations can be treated with specific tyrosine kinase inhibitors (TKIs). Hence, predicting EGFR mutation status can help in clinical decision making. H&E-stained whole slide imaging (WSI) is a routinely performed screening procedure for cancer staging and subtyping, especially affecting the Southeast Asian populations with significantly higher incidence of the mutation when compared to Caucasians (39-64% vs 7-22%). Recent progress in AI models has shown promising results in cancer detection and classification. In this study, we propose a deep learning (DL) framework built on vision transformers (ViT) based pathology foundation model and attention-based multiple instance learning (ABMIL) architecture to predict EGFR mutation status from H&E WSI. The developed pipeline was trained using data from an Indian cohort (170 WSI) and evaluated across two independent datasets: Internal test (30 WSI from Indian cohort) set, and an external test set from TCGA (86 WSI). The model shows consistent performance across both datasets, with AUCs of 0.933 (+/-0.010), and 0.965 (+/-0.015) for the internal and external test sets respectively. This proposed framework can be efficiently trained on small datasets, achieving superior performance as compared to several prior studies irrespective of training domain. The current study demonstrates the feasibility of accurately predicting EGFR mutation status using routine pathology slides, particularly in resource-limited settings using foundation models and attention-based multiple instance learning.
- Abstract(参考訳): 肺腺癌 (LUAD) は非小細胞肺癌(NSCLC)の亜型である。
EGFR遺伝子変異を有するLUADは、LUAD症例の約46%を占める。
EGFR変異を持つ患者は、特定のチロシンキナーゼ阻害剤(TKI)で治療することができる。
したがって、EGFR変異の予測は臨床診断に役立てることができる。
H&E-stained whole slide imaging (WSI)は、がんのステージングとサブタイピングの定期的なスクリーニング方法であり、特に東南アジアの人口に影響を及ぼし、コーカサス (39-64% vs 7-22%) と比較すると、変異の頻度が著しく高かった。
AIモデルの最近の進歩は、がんの検出と分類において有望な結果を示している。
本研究では,視覚トランスフォーマー(ViT)に基づく病理基盤モデルとアテンションベースマルチインスタンスラーニング(ABMIL)アーキテクチャに基づくディープラーニング(DL)フレームワークを提案し,H&E WSIからEGFRの変異状況を予測する。
開発されたパイプラインは、インドのコホート(170 WSI)のデータを用いてトレーニングされ、2つの独立したデータセット(インドコホートから30 WSI)とTCGA(86 WSI)の外部テストセット)で評価された。
このモデルは、両方のデータセットで一貫したパフォーマンスを示し、AUCは、それぞれ内部テストセットと外部テストセットで0.933(+/-0.010)、0.965(+/-0.015)である。
このフレームワークは小さなデータセットで効率的にトレーニングすることができ、トレーニング領域に関係なく、いくつかの先行研究と比較して優れたパフォーマンスを実現することができる。
本研究は、特に基礎モデルを用いたリソース制限設定や注意に基づく複数インスタンス学習において、日常的な病態スライドを用いてEGFR変異状態を正確に予測できる可能性を示した。
関連論文リスト
- Predicting Length of Stay in Neurological ICU Patients Using Classical Machine Learning and Neural Network Models: A Benchmark Study on MIMIC-IV [49.1574468325115]
本研究は、MIMIC-IVデータセットに基づく神経疾患患者を対象とした、ICUにおけるLOS予測のための複数のMLアプローチについて検討する。
評価されたモデルには、古典的MLアルゴリズム(K-Nearest Neighbors、Random Forest、XGBoost、CatBoost)とニューラルネットワーク(LSTM、BERT、テンポラルフュージョントランス)が含まれる。
論文 参考訳(メタデータ) (2025-05-23T14:06:42Z) - Using Pre-training and Interaction Modeling for ancestry-specific disease prediction in UK Biobank [69.90493129893112]
近年のゲノムワイド・アソシエーション(GWAS)研究は、複雑な形質の遺伝的基盤を明らかにしているが、非ヨーロッパ系個体の低発現を示している。
そこで本研究では,マルチオミクスデータを用いて,多様な祖先間での疾患予測を改善することができるかを評価する。
論文 参考訳(メタデータ) (2024-04-26T16:39:50Z) - Variational Autoencoders for Feature Exploration and Malignancy
Prediction of Lung Lesions [0.0]
肺がんはイギリスで21%のがん死の原因となっている。
最近の研究は、定期的なスキャンから肺がんの正確な早期診断のためのAI手法の能力を実証している。
本研究では, 変異型オートエンコーダ(VAE)の肺癌病変に対する応用について検討した。
論文 参考訳(メタデータ) (2023-11-27T11:12:33Z) - Deep Learning for Predicting Progression of Patellofemoral
Osteoarthritis Based on Lateral Knee Radiographs, Demographic Data and
Symptomatic Assessments [1.1549572298362785]
本研究はMOST研究のベースラインから被験者(被験者1832名,膝3276名)を抽出した。
PF関節領域は, 側膝X線上の自動ランドマーク検出ツール(BoneFinder)を用いて同定した。
年齢、性別、BMIおよびWOMACスコア、および大腿骨関節X線学的関節炎ステージ(KLスコア)の危険因子について
論文 参考訳(メタデータ) (2023-05-10T06:43:33Z) - Multivariate Analysis on Performance Gaps of Artificial Intelligence
Models in Screening Mammography [4.123006816939975]
異常分類のための深層学習モデルは,マンモグラフィーのスクリーニングにおいて良好に機能する。
モデル不全のリスクの増加に伴う人口統計学的、画像的、臨床的特徴はいまだに不明である。
年齢,人種,病理所見,組織密度,画像特徴によって定義されるサブグループによるモデル性能の評価を行った。
論文 参考訳(メタデータ) (2023-05-08T02:28:45Z) - EGFR Mutation Prediction of Lung Biopsy Images using Deep Learning [1.793983482813105]
本研究では,EGFR変異の形態的相関を識別するために,教師の弱いカスタマイズ深層学習パイプラインを用いた。
病理組織学的に腺癌と扁平上皮癌との鑑別は0.942であった。
EGFR検出では,TGAデータセットでは平均0.864AUC,インドからのデータセットでは0.783AUCを達成した。
論文 参考訳(メタデータ) (2022-08-26T08:56:33Z) - Systematic investigation into generalization of COVID-19 CT deep
learning models with Gabor ensemble for lung involvement scoring [9.94980188821453]
本研究は,COVID-19 CTデータを用いたキーパブリッシュモデルの一般化可能性について検討する。
次に、独立した新しいデータセットを使用して、新型コロナウイルスの重症度に関するこれらのモデルの予測能力を評価する。
論文 参考訳(メタデータ) (2021-04-20T03:49:48Z) - Bootstrapping Your Own Positive Sample: Contrastive Learning With
Electronic Health Record Data [62.29031007761901]
本稿では,新しいコントラスト型正規化臨床分類モデルを提案する。
EHRデータに特化した2つのユニークなポジティブサンプリング戦略を紹介します。
私たちのフレームワークは、現実世界のCOVID-19 EHRデータの死亡リスクを予測するために、競争の激しい実験結果をもたらします。
論文 参考訳(メタデータ) (2021-04-07T06:02:04Z) - Deep learning-based COVID-19 pneumonia classification using chest CT
images: model generalizability [54.86482395312936]
深層学習(DL)分類モデルは、異なる国の3DCTデータセット上で、COVID-19陽性患者を特定するために訓練された。
我々は、データセットと72%の列車、8%の検証、20%のテストデータを組み合わせたDLベースの9つの同一分類モデルを訓練した。
複数のデータセットでトレーニングされ、トレーニングに使用されるデータセットの1つからテストセットで評価されたモデルは、よりよいパフォーマンスを示した。
論文 参考訳(メタデータ) (2021-02-18T21:14:52Z) - Adversarial Sample Enhanced Domain Adaptation: A Case Study on
Predictive Modeling with Electronic Health Records [57.75125067744978]
ドメイン適応を容易にするデータ拡張手法を提案する。
逆生成したサンプルはドメイン適応時に使用される。
その結果,本手法の有効性とタスクの一般性が確認された。
論文 参考訳(メタデータ) (2021-01-13T03:20:20Z) - Predicting Clinical Diagnosis from Patients Electronic Health Records
Using BERT-based Neural Networks [62.9447303059342]
医療コミュニティにおけるこの問題の重要性を示す。
本稿では,変換器 (BERT) モデルによる2方向表現の分類順序の変更について述べる。
約400万人のユニークな患者訪問からなる、大規模なロシアのEHRデータセットを使用します。
論文 参考訳(メタデータ) (2020-07-15T09:22:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。