論文の概要: CNN-LSTM Hybrid Model for AI-Driven Prediction of COVID-19 Severity from Spike Sequences and Clinical Data
- arxiv url: http://arxiv.org/abs/2505.23879v1
- Date: Thu, 29 May 2025 16:20:54 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-02 19:47:52.59735
- Title: CNN-LSTM Hybrid Model for AI-Driven Prediction of COVID-19 Severity from Spike Sequences and Clinical Data
- Title(参考訳): スパイクシーケンスと臨床データを用いたCNN-LSTMハイブリッドモデルによる新型コロナウイルス重症度予測
- Authors: Caio Cheohen, Vinnícius M. S. Gomes, Manuela L. da Silva,
- Abstract要約: スパイクタンパク質配列と臨床データを用いたCNN-LSTMハイブリッドモデルを構築した。
このモデルはF1スコア82.92%、ROC-AUC 0.9084、精度83.56%、リコール82.85%を達成した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: The COVID-19 pandemic, caused by SARS-CoV-2, highlighted the critical need for accurate prediction of disease severity to optimize healthcare resource allocation and patient management. The spike protein, which facilitates viral entry into host cells, exhibits high mutation rates, particularly in the receptor-binding domain, influencing viral pathogenicity. Artificial intelligence approaches, such as deep learning, offer promising solutions for leveraging genomic and clinical data to predict disease outcomes. Objective: This study aimed to develop a hybrid CNN-LSTM deep learning model to predict COVID-19 severity using spike protein sequences and associated clinical metadata from South American patients. Methods: We retrieved 9,570 spike protein sequences from the GISAID database, of which 3,467 met inclusion criteria after standardization. The dataset included 2,313 severe and 1,154 mild cases. A feature engineering pipeline extracted features from sequences, while demographic and clinical variables were one-hot encoded. A hybrid CNN-LSTM architecture was trained, combining CNN layers for local pattern extraction and an LSTM layer for long-term dependency modeling. Results: The model achieved an F1 score of 82.92%, ROC-AUC of 0.9084, precision of 83.56%, and recall of 82.85%, demonstrating robust classification performance. Training stabilized at 85% accuracy with minimal overfitting. The most prevalent lineages (P.1, AY.99.2) and clades (GR, GK) aligned with regional epidemiological trends, suggesting potential associations between viral genetics and clinical outcomes. Conclusion: The CNN-LSTM hybrid model effectively predicted COVID-19 severity using spike protein sequences and clinical data, highlighting the utility of AI in genomic surveillance and precision public health. Despite limitations, this approach provides a framework for early severity prediction in future outbreaks.
- Abstract(参考訳): SARS-CoV-2による新型コロナウイルスのパンデミックは、医療資源の配分と患者の管理を最適化するために、病気の重症度を正確に予測するための重要な必要性を強調した。
宿主細胞へのウイルス侵入を促進するスパイクタンパク質は、特に受容体結合ドメインにおいて高い突然変異率を示し、ウイルスの病原性に影響を与える。
ディープラーニングのような人工知能アプローチは、ゲノムデータと臨床データを利用して病気の結果を予測する、有望なソリューションを提供する。
目的: 本研究の目的は, スパイクタンパク質配列および関連臨床メタデータを用いたCNN-LSTMハイブリッド深層学習モデルの構築である。
方法: GISAIDデータベースから9,570件のスパイクタンパク質配列を検索し,その内3,467件が標準化後の包含基準を満たした。
データセットには2,313件の重篤な症例と1,154件の軽微なケースが含まれていた。
特徴工学パイプラインはシーケンスから特徴を抽出し、人口統計学および臨床変数は1ホットエンコードされた。
局所パターン抽出のためのCNN層と長期依存性モデリングのためのLSTM層を組み合わせたハイブリッドCNN-LSTMアーキテクチャを訓練した。
結果: モデルはF1スコア82.92%、ROC-AUC0.9084、精度83.56%、リコール82.85%を達成し、堅牢な分類性能を示した。
トレーニングは、最小限のオーバーフィッティングで85%の精度で安定した。
最も一般的な系統(P.1, AY.99.2)とクレード(GR, GK)は、地域疫学の傾向に沿っており、ウイルス遺伝学と臨床結果の潜在的な関連性を示唆している。
結論: CNN-LSTMハイブリッドモデルは、スパイクタンパク質配列と臨床データを用いて、新型コロナウイルスの重症度を効果的に予測し、ゲノム監視と精密公衆衛生におけるAIの有用性を強調した。
制限にもかかわらず、このアプローチは、将来のアウトブレイクにおける早期重症度予測のためのフレームワークを提供する。
関連論文リスト
- Epidemic Forecasting with a Hybrid Deep Learning Method Using CNN-LSTM With WOA-GWO Parameter Optimization: Global COVID-19 Case Study [0.0]
本研究では,感染症の時系列予測を推し進める新たな深層学習フレームワークを提案する。
本フレームワークは6大陸24カ国の新型コロナウイルス19症例データに適用した。
論文 参考訳(メタデータ) (2025-03-17T04:41:26Z) - Prediction of Lung Metastasis from Hepatocellular Carcinoma using the SEER Database [0.9055332067000195]
肝細胞癌(HCC)は、がん関連死亡の原因である。
HCCにおける肺転移の予測モデルは、範囲と臨床応用性に限られている。
本研究では,Surveillance, Epidemiology, End Results (SEER)データベースのデータを用いて,エンドツーエンドの機械学習パイプラインの開発と検証を行う。
論文 参考訳(メタデータ) (2025-01-20T20:06:31Z) - CRTRE: Causal Rule Generation with Target Trial Emulation Framework [47.2836994469923]
ターゲットトライアルエミュレーションフレームワーク(CRTRE)を用いた因果ルール生成という新しい手法を提案する。
CRTREは、アソシエーションルールの因果効果を推定するためにランダム化トライアル設計原則を適用している。
次に、病気発症予測などの下流アプリケーションにそのような関連ルールを組み込む。
論文 参考訳(メタデータ) (2024-11-10T02:40:06Z) - Using Pre-training and Interaction Modeling for ancestry-specific disease prediction in UK Biobank [69.90493129893112]
近年のゲノムワイド・アソシエーション(GWAS)研究は、複雑な形質の遺伝的基盤を明らかにしているが、非ヨーロッパ系個体の低発現を示している。
そこで本研究では,マルチオミクスデータを用いて,多様な祖先間での疾患予測を改善することができるかを評価する。
論文 参考訳(メタデータ) (2024-04-26T16:39:50Z) - CEL: A Continual Learning Model for Disease Outbreak Prediction by
Leveraging Domain Adaptation via Elastic Weight Consolidation [4.693707128262634]
本研究では,EWC(Elastic Weight Consolidation)による領域適応を利用した連続学習のための新しいCELモデルを提案する。
CELの堅牢性と信頼性は、既存のベンチマーク研究と比較して65%の忘れ込み率と18%のメモリ安定性で裏付けられている。
論文 参考訳(メタデータ) (2024-01-17T03:26:04Z) - Improving COVID-19 CT Classification of CNNs by Learning
Parameter-Efficient Representation [31.51725965329019]
深層学習法は, コンピュータ断層撮影による新型コロナウイルスの自動診断を支援するために提案されている。
DenseNet121は、正常、非COVID-19肺炎、COVID-19肺炎を含む3つのカテゴリーの分類で、平均99.44%の検査精度を達成している。
論文 参考訳(メタデータ) (2022-08-09T12:24:53Z) - The Report on China-Spain Joint Clinical Testing for Rapid COVID-19 Risk
Screening by Eye-region Manifestations [59.48245489413308]
携帯電話カメラで中国とスペインで撮影された視線領域の画像を用いて、新型コロナウイルスの早期スクリーニングモデルを開発し、テストした。
AUC, 感度, 特異性, 精度, F1。
論文 参考訳(メタデータ) (2021-09-18T02:28:01Z) - Bootstrapping Your Own Positive Sample: Contrastive Learning With
Electronic Health Record Data [62.29031007761901]
本稿では,新しいコントラスト型正規化臨床分類モデルを提案する。
EHRデータに特化した2つのユニークなポジティブサンプリング戦略を紹介します。
私たちのフレームワークは、現実世界のCOVID-19 EHRデータの死亡リスクを予測するために、競争の激しい実験結果をもたらします。
論文 参考訳(メタデータ) (2021-04-07T06:02:04Z) - UNITE: Uncertainty-based Health Risk Prediction Leveraging Multi-sourced
Data [81.00385374948125]
我々はUNcertaInTyベースのhEalth Risk Prediction(UNITE)モデルを提案する。
UNITEは、複数ソースの健康データを活用した正確な疾患リスク予測と不確実性推定を提供する。
非アルコール性脂肪肝疾患(NASH)とアルツハイマー病(AD)の実態予測タスクにおけるUNITEの評価を行った。
UNITEはAD検出のF1スコアで最大0.841点、NASH検出のPR-AUCで最大0.609点を達成し、最高のベースラインで最大19%の高パフォーマンスを達成している。
論文 参考訳(メタデータ) (2020-10-22T02:28:11Z) - CovidDeep: SARS-CoV-2/COVID-19 Test Based on Wearable Medical Sensors
and Efficient Neural Networks [51.589769497681175]
新型コロナウイルス(SARS-CoV-2)がパンデミックを引き起こしている。
SARS-CoV-2の逆転写-ポリメラーゼ連鎖反応に基づく現在の試験体制は、試験要求に追いついていない。
我々は,効率的なDNNと市販のWMSを組み合わせたCovidDeepというフレームワークを提案する。
論文 参考訳(メタデータ) (2020-07-20T21:47:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。