論文の概要: GastroDL-Fusion: A Dual-Modal Deep Learning Framework Integrating Protein-Ligand Complexes and Gene Sequences for Gastrointestinal Disease Drug Discovery
- arxiv url: http://arxiv.org/abs/2511.05726v1
- Date: Fri, 07 Nov 2025 21:32:58 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-11 21:18:44.549123
- Title: GastroDL-Fusion: A Dual-Modal Deep Learning Framework Integrating Protein-Ligand Complexes and Gene Sequences for Gastrointestinal Disease Drug Discovery
- Title(参考訳): 消化器疾患発見のためのタンパク質-リガンド複合体と遺伝子配列を統合したデュアルモーダルディープラーニングフレームワーク
- Authors: Ziyang Gao, Annie Cheung, Yihao Ou,
- Abstract要約: GastroDL-Fusionは、タンパク質-リガンド複合体データと疾患関連遺伝子配列情報を統合するデュアルモーダルディープラーニングフレームワークである。
我々はGI病関連ターゲットのベンチマークデータセットを用いてモデルを評価する。
結果は、構造的特徴と遺伝的特徴の両方を取り入れることで、結合親和性のより正確な予測が得られることを確認した。
- 参考スコア(独自算出の注目度): 2.1880525779004563
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Accurate prediction of protein-ligand binding affinity plays a pivotal role in accelerating the discovery of novel drugs and vaccines, particularly for gastrointestinal (GI) diseases such as gastric ulcers, Crohn's disease, and ulcerative colitis. Traditional computational models often rely on structural information alone and thus fail to capture the genetic determinants that influence disease mechanisms and therapeutic responses. To address this gap, we propose GastroDL-Fusion, a dual-modal deep learning framework that integrates protein-ligand complex data with disease-associated gene sequence information for drug and vaccine development. In our approach, protein-ligand complexes are represented as molecular graphs and modeled using a Graph Isomorphism Network (GIN), while gene sequences are encoded into biologically meaningful embeddings via a pre-trained Transformer (ProtBERT/ESM). These complementary modalities are fused through a multi-layer perceptron to enable robust cross-modal interaction learning. We evaluate the model on benchmark datasets of GI disease-related targets, demonstrating that GastroDL-Fusion significantly improves predictive performance over conventional methods. Specifically, the model achieves a mean absolute error (MAE) of 1.12 and a root mean square error (RMSE) of 1.75, outperforming CNN, BiLSTM, GIN, and Transformer-only baselines. These results confirm that incorporating both structural and genetic features yields more accurate predictions of binding affinities, providing a reliable computational tool for accelerating the design of targeted therapies and vaccines in the context of gastrointestinal diseases.
- Abstract(参考訳): タンパク質-リガンド結合親和性の正確な予測は、特に胃潰瘍、クローン病、潰瘍性大腸炎などの消化器疾患において、新しい薬物やワクチンの発見を加速させる重要な役割を担っている。
従来の計算モデルは構造情報のみに依存しており、疾患のメカニズムや治療反応に影響を与える遺伝的決定因子を捉えることができないことが多い。
このギャップに対処するために,タンパク質-リガンド複合体データと疾患関連遺伝子配列情報を統合するデュアルモーダル深層学習フレームワークであるGastroDL-Fusionを提案する。
本手法では,タンパク質-リガンド複合体を分子グラフとして表現し,グラフアイソモルフィズムネットワーク(GIN)を用いてモデル化し,遺伝子配列を事前学習したトランスフォーマー(ProtBERT/ESM)を介して生物学的に意味のある埋め込みにコードする。
これらの相補的なモダリティは多層パーセプトロンを介して融合され、堅牢な相互モーダル相互作用学習を可能にする。
GI病関連ターゲットのベンチマークデータセットを用いて,ガストロDLフュージョンが従来手法よりも予測性能を大幅に向上することを示す。
具体的には、1.12の平均絶対誤差(MAE)と1.75の平均平方誤差(RMSE)を達成し、CNN、BiLSTM、GIN、Transformerのみのベースラインを上回っている。
これらの結果は、構造的特徴と遺伝的特徴の両方を取り入れることで、より正確な結合親和性の予測が得られ、消化管疾患の文脈における標的治療とワクチンの設計を加速するための信頼性の高い計算ツールを提供する。
関連論文リスト
- A Machine Learning Framework for Pathway-Driven Therapeutic Target Discovery in Metabolic Disorders [1.41678086736482]
本研究では,遺伝子に依存しない経路マッピングと予測モデリングを統合し,リスクの高い個人を特定する新しい機械学習(ML)フレームワークを提案する。
ピマ・インディアンのデータセットを用いて、T2DMの重要な予測因子を特定するためにロジスティック回帰とt-testを適用し、全体のモデル精度は78.43%となった。
論文 参考訳(メタデータ) (2025-09-14T19:29:52Z) - Unlasting: Unpaired Single-Cell Multi-Perturbation Estimation by Dual Conditional Diffusion Implicit Bridges [68.98973318553983]
本稿では,Dual Diffusion Implicit Bridges (DDIB) に基づくフレームワークを提案する。
我々は、生物学的に意味のある方法で摂動シグナルを伝達するために遺伝子制御ネットワーク(GRN)情報を統合する。
また、サイレント遺伝子を予測し、生成したプロファイルの品質を向上させるためのマスキング機構も組み込んだ。
論文 参考訳(メタデータ) (2025-06-26T09:05:38Z) - KEPLA: A Knowledge-Enhanced Deep Learning Framework for Accurate Protein-Ligand Binding Affinity Prediction [60.23701115249195]
KEPLAは、遺伝子オントロジーとリガンド特性の事前知識を統合し、予測性能を向上させる新しいディープラーニングフレームワークである。
2つのベンチマークデータセットの実験では、KEPLAは一貫して最先端のベースラインを上回っている。
論文 参考訳(メタデータ) (2025-06-16T08:02:42Z) - Interpretable Graph Kolmogorov-Arnold Networks for Multi-Cancer Classification and Biomarker Identification using Multi-Omics Data [36.92842246372894]
Multi-Omics Graph Kolmogorov-Arnold Network (MOGKAN)は、メッセンジャーRNA、マイクロRNA配列、DNAメチル化サンプルを利用するディープラーニングフレームワークである。
グラフに基づく深層学習とマルチオミクスデータを統合することにより,提案手法は頑健な予測性能と解釈可能性を示す。
論文 参考訳(メタデータ) (2025-03-29T02:14:05Z) - scGSDR: Harnessing Gene Semantics for Single-Cell Pharmacological Profiling [5.831554646284266]
scGSDRは、細胞状態と遺伝子シグナル伝達経路の知識に基づく2つの計算パイプラインを統合するモデルである。
scGSDRは、遺伝子セマンティクスを組み込んで予測性能を高め、解釈可能性モジュールを使用する。
モデルはシングルドラッグの予測からドラッグの組み合わせを含むシナリオまで拡張された。
論文 参考訳(メタデータ) (2025-02-02T15:43:20Z) - Comprehensive Metapath-based Heterogeneous Graph Transformer for Gene-Disease Association Prediction [19.803593399456823]
Metapath-based heterogeneous graph Transformer (COMET) を用いた遺伝子解析
本手法は, 最先端手法と比較して, 優れたロバスト性を示す。
論文 参考訳(メタデータ) (2025-01-14T09:41:18Z) - Explainable AI model reveals disease-related mechanisms in single-cell RNA-seq data [2.975735171548829]
神経変性疾患(NDD)は複雑で、そのメカニズムがよく理解されていないため、治療が不十分である。
本研究では,病気関連遺伝子を同定する手法を実装し,NNモデルとSHAPを併用した疾患進行の機械的説明を行う。
以上の結果から,DGEとSHAPのアプローチは,遺伝子と経路の共通セットと差分セットの両方を提供し,XAI法の有用性を,より広範な疾患の観点で強化することを示した。
論文 参考訳(メタデータ) (2025-01-07T16:35:29Z) - Gene-Metabolite Association Prediction with Interactive Knowledge Transfer Enhanced Graph for Metabolite Production [49.814615043389864]
メタボリックグラフに基づく遺伝子メタボリック・アソシエーション・アソシエーション・アソシエーション・アソシエーション・アソシエーション・アソシエーション・アソシエーション・アソシエーション・アソシエーション・アソシエーション・アソシエーション・アソシエーション・アソシエーション
2474の代謝産物と1947年の2つの一般的な微生物の遺伝子を含む最初のベンチマークを提示する。
提案手法は,各種リンク予測フレームワークのベースラインを最大12.3%向上させる。
論文 参考訳(メタデータ) (2024-10-24T06:54:27Z) - Using Pre-training and Interaction Modeling for ancestry-specific disease prediction in UK Biobank [69.90493129893112]
近年のゲノムワイド・アソシエーション(GWAS)研究は、複雑な形質の遺伝的基盤を明らかにしているが、非ヨーロッパ系個体の低発現を示している。
そこで本研究では,マルチオミクスデータを用いて,多様な祖先間での疾患予測を改善することができるかを評価する。
論文 参考訳(メタデータ) (2024-04-26T16:39:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。