論文の概要: GraphGDel: Constructing and Learning Graph Representations of Genome-Scale Metabolic Models for Growth-Coupled Gene Deletion Prediction
- arxiv url: http://arxiv.org/abs/2504.06316v6
- Date: Mon, 10 Nov 2025 04:24:28 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-11 19:11:14.13552
- Title: GraphGDel: Constructing and Learning Graph Representations of Genome-Scale Metabolic Models for Growth-Coupled Gene Deletion Prediction
- Title(参考訳): GraphGDel:成長結合遺伝子削除予測のためのゲノム規模の代謝モデルの構築と学習グラフ表現
- Authors: Ziwei Yang, Takeyuki Tamura,
- Abstract要約: 本稿では,制約に基づくメタボリックモデルからグラフ表現を構築するための体系的なパイプラインを提案する。
第2に,これらのグラフ表現を遺伝子およびメタボライト配列データと統合し,成長に結合した遺伝子削除戦略を予測するディープラーニングフレームワークを開発する。
我々のアプローチは確立されたベースラインを一貫して上回り、全体的な精度で14.04%、16.26%、13.18%の改善を実現している。
- 参考スコア(独自算出の注目度): 1.0909000338858534
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In genome-scale constraint-based metabolic models, gene deletion strategies are essential for achieving growth-coupled production, where cell growth and target metabolite synthesis occur simultaneously. Despite the inherently networked nature of genome-scale metabolic models, existing computational approaches rely primarily on sequential data and lack graph representations that capture their complex relationships, as both well-defined graph constructions and learning frameworks capable of exploiting them remain largely unexplored. To address this gap, we present a twofold solution. First, we introduce a systematic pipeline for constructing graph representations from constraint-based metabolic models. Second, we develop a deep learning framework that integrates these graph representations with gene and metabolite sequence data to predict growth-coupled gene deletion strategies. Across three metabolic models of varying scale, our approach consistently outperforms established baselines, achieves improvements of 14.04%, 16.26%, and 13.18% in overall accuracy. The source code and example datasets are available at: https://github.com/MetNetComp/GraphGDel.
- Abstract(参考訳): ゲノムスケールの制約に基づく代謝モデルでは、細胞成長と標的代謝物合成が同時に起こる成長結合生産を達成するために遺伝子欠失戦略が不可欠である。
ゲノムスケールのメタボリックモデルの本質的にネットワーク化された性質にもかかわらず、既存の計算手法は主にシーケンシャルなデータに依存し、それらの複雑な関係を捉えるグラフ表現が欠如している。
このギャップに対処するため、我々は2つの解を提示する。
まず,制約に基づくメタボリックモデルからグラフ表現を構築するための体系的なパイプラインを提案する。
第2に,これらのグラフ表現を遺伝子およびメタボライト配列データと統合し,成長に結合した遺伝子削除戦略を予測するディープラーニングフレームワークを開発する。
様々なスケールの3つの代謝モデルにおいて、我々のアプローチは確立されたベースラインを一貫して上回り、14.04%、16.26%、13.18%の改善を実現している。
ソースコードとサンプルデータセットは、https://github.com/MetNetComp/GraphGDelで入手できる。
関連論文リスト
- Modeling Gene Expression Distributional Shifts for Unseen Genetic Perturbations [44.619690829431214]
遺伝的摂動に伴う遺伝子発現の分布応答を予測するニューラルネットワークを訓練する。
本モデルでは, 摂動を条件とした遺伝子レベルのヒストグラムを予測し, 高次統計値の取得において, 基準値よりも優れていた。
論文 参考訳(メタデータ) (2025-07-01T06:04:28Z) - Bidirectional Mamba for Single-Cell Data: Efficient Context Learning with Biological Fidelity [0.39945675027960637]
我々は、状態空間モデリングに基づいて構築された単一セル転写学のスケーラブルで効率的な基礎モデルであるGeneMambaを紹介した。
GeneMambaは、双方向の遺伝子コンテキストを線形時間複雑性でキャプチャし、トランスフォーマーベースラインよりもかなりの計算的ゲインを提供する。
我々は、マルチバッチ統合、細胞型アノテーション、遺伝子-遺伝子相関など様々なタスクにまたがってGeneMambaを評価し、高い性能、解釈可能性、堅牢性を示す。
論文 参考訳(メタデータ) (2025-04-22T20:34:47Z) - Transformer-Based Representation Learning for Robust Gene Expression Modeling and Cancer Prognosis [3.782770832189636]
本稿では、遺伝子発現データの堅牢な表現学習のためのトランスフォーマーベースのオートエンコーダフレームワークであるGexBERTを提案する。
GexBERTは、大規模転写プロファイルを事前学習することで、文脈認識遺伝子埋め込みを学習する。
限られた遺伝子サブセットから最先端の分類精度を達成し、予後アンカー遺伝子の発現を回復させることで生存予測を改善し、欠失率の高い従来の計算方法より優れている。
論文 参考訳(メタデータ) (2025-04-13T19:49:59Z) - Teaching pathology foundation models to accurately predict gene expression with parameter efficient knowledge transfer [1.5416321520529301]
PEKA(Efficient Knowledge Adaptation)は、クロスモーダルな知識伝達のための知識蒸留と構造アライメント損失を統合する新しいフレームワークである。
複数の空間転写学データセットを用いた遺伝子発現予測のためのPEKAの評価を行った。
論文 参考訳(メタデータ) (2025-04-09T17:24:41Z) - Beyond Progress Measures: Theoretical Insights into the Mechanism of Grokking [50.465604300990904]
グロキング(Grokking)とは、オーバーフィッティングの拡張後のテスト精度の急激な改善を指す。
本研究では、素数演算のタスクにおいて、Transformerの基盤となるグルーキング機構について検討する。
論文 参考訳(メタデータ) (2025-04-04T04:42:38Z) - GENERator: A Long-Context Generative Genomic Foundation Model [66.46537421135996]
本稿では,98k塩基対 (bp) と1.2Bパラメータからなるゲノム基盤モデル GENERator を提案する。
DNAの386Bbpからなる拡張データセットに基づいて、GENERatorは、確立されたベンチマークと新しく提案されたベンチマークの両方で最先端のパフォーマンスを実証する。
また、特に特定のアクティビティプロファイルを持つエンハンサーシーケンスを即応的に生成することで、シーケンス最適化において大きな可能性を秘めている。
論文 参考訳(メタデータ) (2025-02-11T05:39:49Z) - Stochastic gradient descent estimation of generalized matrix factorization models with application to single-cell RNA sequencing data [41.94295877935867]
単細胞RNAシークエンシングは、個々の細胞レベルでの遺伝子発現の定量化を可能にする。
次元の減少は、サンプルの可視化、クラスタリング、表現型特徴付けを単純化する一般的な前処理ステップである。
一般指数分散族分布を仮定した一般化行列分解モデルを提案する。
本稿では,モデルを効率的に推定できるスケーラブル適応降下アルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-12-29T16:02:15Z) - Evaluating Deep Regression Models for WSI-Based Gene-Expression Prediction [3.2995359570845912]
通常の全スライディング画像から直接mRNA遺伝子の発現プロファイルを予測することは、コスト効率が高く、広くアクセス可能な分子表現型を提供する可能性がある。
本研究は、WSIに基づく遺伝子発現予測のために、どのように深部回帰モデルをトレーニングすべきかを推奨する。
論文 参考訳(メタデータ) (2024-10-01T16:00:22Z) - VQDNA: Unleashing the Power of Vector Quantization for Multi-Species Genomic Sequence Modeling [60.91599380893732]
VQDNAは、ゲノムボキャブラリ学習の観点からゲノムのトークン化を改良する汎用フレームワークである。
ベクトル量子化されたコードブックを学習可能な語彙として活用することにより、VQDNAはゲノムをパターン認識の埋め込みに適応的にトークン化することができる。
論文 参考訳(メタデータ) (2024-05-13T20:15:03Z) - Efficient and Scalable Fine-Tune of Language Models for Genome
Understanding [49.606093223945734]
textscLanguage prefix ftextscIne-tuning for textscGentextscOmes。
DNA基盤モデルとは異なり、textscLingoは自然言語基盤モデルの文脈的手がかりを戦略的に活用している。
textscLingoはさらに、適応的なランクサンプリング方法により、下流の細調整タスクを数多く許容する。
論文 参考訳(メタデータ) (2024-02-12T21:40:45Z) - Single-Cell Deep Clustering Method Assisted by Exogenous Gene
Information: A Novel Approach to Identifying Cell Types [50.55583697209676]
我々は,細胞間のトポロジ的特徴を効率的に捉えるために,注目度の高いグラフオートエンコーダを開発した。
クラスタリング過程において,両情報の集合を統合し,細胞と遺伝子の特徴を再構成し,識別的表現を生成する。
本研究は、細胞の特徴と分布に関する知見を高め、疾患の早期診断と治療の基礎となる。
論文 参考訳(メタデータ) (2023-11-28T09:14:55Z) - Causal machine learning for single-cell genomics [94.28105176231739]
単細胞ゲノミクスへの機械学習技術の応用とその課題について論じる。
まず, 単一細胞生物学における現在の因果的アプローチの基盤となるモデルについて述べる。
次に、単一セルデータへの因果的アプローチの適用におけるオープンな問題を特定する。
論文 参考訳(メタデータ) (2023-10-23T13:35:24Z) - Genetic Imitation Learning by Reward Extrapolation [6.340280403330784]
我々は,遺伝的アルゴリズムと模倣学習を統合したGenILという手法を提案する。
遺伝的アルゴリズムの関与は、様々なリターンで軌道を再現することで、データ効率を向上させる。
我々はAtariドメインとMujocoドメインの両方でGenILをテストし、その結果、以前の手法よりも優れた性能を示した。
論文 参考訳(メタデータ) (2023-01-03T14:12:28Z) - CausalBench: A Large-scale Benchmark for Network Inference from
Single-cell Perturbation Data [61.088705993848606]
本稿では,実世界の介入データに対する因果推論手法を評価するベンチマークスイートCausalBenchを紹介する。
CaulBenchには、新しい分散ベースの介入メトリクスを含む、生物学的に動機付けられたパフォーマンスメトリクスが含まれている。
論文 参考訳(メタデータ) (2022-10-31T13:04:07Z) - Modelling Technical and Biological Effects in scRNA-seq data with
Scalable GPLVMs [6.708052194104378]
我々は,ガウス過程潜在変数モデルである確率的非線形次元減少に対する一般的なアプローチを拡張し,大規模単一セルデータセットに拡張する。
鍵となる考え方は、高速な変動推論を可能にする下位境界の分解可能性を保存する拡張カーネルを使用することである。
論文 参考訳(メタデータ) (2022-09-14T15:25:15Z) - On the Generalization and Adaption Performance of Causal Models [99.64022680811281]
異なる因果発見は、データ生成プロセスを一連のモジュールに分解するために提案されている。
このようなモジュラニューラル因果モデルの一般化と適応性能について検討する。
我々の分析では、モジュラーニューラル因果モデルが、低データレギュレーションにおけるゼロおよび少数ショットの適応において、他のモデルよりも優れていることを示している。
論文 参考訳(メタデータ) (2022-06-09T17:12:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。