論文の概要: Beyond Independent Genes: Learning Module-Inductive Representations for Gene Perturbation Prediction
- arxiv url: http://arxiv.org/abs/2602.04901v1
- Date: Tue, 03 Feb 2026 16:43:40 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-06 18:49:08.522391
- Title: Beyond Independent Genes: Learning Module-Inductive Representations for Gene Perturbation Prediction
- Title(参考訳): Beyond Independent Genes: Learning Module-Inductive Representation for Gene Perturbation Prediction
- Authors: Jiafa Ruan, Ruijie Quan, Zongxin Yang, Liyang Xu, Yi Yang,
- Abstract要約: scBIGは、協調した遺伝子プログラムを明示的にモデル化するモジュール誘導予測フレームワークである。
scBIGは、特に目に見えない、摂動的な設定において、最先端のメソッドを一貫して上回る。
- 参考スコア(独自算出の注目度): 48.80217316452559
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Predicting transcriptional responses to genetic perturbations is a central problem in functional genomics. In practice, perturbation responses are rarely gene-independent but instead manifest as coordinated, program-level transcriptional changes among functionally related genes. However, most existing methods do not explicitly model such coordination, due to gene-wise modeling paradigms and reliance on static biological priors that cannot capture dynamic program reorganization. To address these limitations, we propose scBIG, a module-inductive perturbation prediction framework that explicitly models coordinated gene programs. scBIG induces coherent gene programs from data via Gene-Relation Clustering, captures inter-program interactions through a Gene-Cluster-Aware Encoder, and preserves modular coordination using structure-aware alignment objectives. These structured representations are then modeled using conditional flow matching to enable flexible and generalizable perturbation prediction. Extensive experiments on multiple single-cell perturbation benchmarks show that scBIG consistently outperforms state-of-the-art methods, particularly on unseen and combinatorial perturbation settings, achieving an average improvement of 6.7% over the strongest baselines.
- Abstract(参考訳): 遺伝子摂動に対する転写応答の予測は機能ゲノム学における中心的な問題である。
実際には摂動反応は遺伝子に依存しないことが多いが、機能的関連遺伝子間の協調的、プログラムレベルの転写変化として表される。
しかし、ほとんどの既存の手法は、遺伝子モデリングのパラダイムと動的プログラム再構成を捉えることができない静的な生物学的先行性に依存しているため、そのような協調を明示的にモデル化していない。
このような制約に対処するため,協調した遺伝子プログラムを明示的にモデル化するモジュール誘導摂動予測フレームワークである scBIG を提案する。
scBIGは、Gene-Relation Clusteringを介してデータからコヒーレントな遺伝子プログラムを誘導し、Gene-Cluster-Aware Encoderを介してプログラム間相互作用をキャプチャし、構造認識アライメントの目的を用いてモジュール調整を保存する。
これらの構造化された表現は、フレキシブルで一般化可能な摂動予測を可能にする条件付きフローマッチングを用いてモデル化される。
複数の単細胞摂動ベンチマークの大規模な実験により、ScBIGは最先端の手法、特に目に見えない、複合的な摂動設定で一貫して性能を上回り、最強のベースラインよりも平均6.7%向上した。
関連論文リスト
- Scalable Single-Cell Gene Expression Generation with Latent Diffusion Models [11.343106383645441]
単一細胞遺伝子発現データに対してスケーラブルな潜伏拡散モデルを導入し、これを scLDM と呼ぶ。
観測および摂動単細胞データおよびセルレベルの分類などの下流タスクにおいて,様々な実験において,その優れた性能を示す。
論文 参考訳(メタデータ) (2025-11-04T20:44:12Z) - GRAPE: Heterogeneous Graph Representation Learning for Genetic Perturbation with Coding and Non-Coding Biotype [51.58774936662233]
遺伝子制御ネットワーク(GRN)の構築は、遺伝的摂動の影響を理解し予測するために不可欠である。
本研究では,事前学習した大規模言語モデルとDNAシークエンスモデルを用いて,遺伝子記述やDNAシークエンスデータから特徴を抽出する。
我々は、遺伝子摂動において初めて遺伝子バイオタイプ情報を導入し、細胞プロセスの制御において異なるバイオタイプを持つ遺伝子の異なる役割をシミュレートした。
論文 参考訳(メタデータ) (2025-05-06T03:35:24Z) - A scalable gene network model of regulatory dynamics in single cells [88.48246132084441]
本稿では,遺伝子ネットワーク構造を結合微分方程式に組み込んで,遺伝子制御関数をモデル化する機能的学習可能モデルFLeCSを提案する。
FLeCS は (pseudo) 時系列の単一セルデータから, セルの動態を正確に推定する。
論文 参考訳(メタデータ) (2025-03-25T19:19:21Z) - GENERator: A Long-Context Generative Genomic Foundation Model [66.46537421135996]
本稿では,98k塩基対 (bp) と1.2Bパラメータからなるゲノム基盤モデル GENERator を提案する。
DNAの386Bbpからなる拡張データセットに基づいて、GENERatorは、確立されたベンチマークと新しく提案されたベンチマークの両方で最先端のパフォーマンスを実証する。
また、特に特定のアクティビティプロファイルを持つエンハンサーシーケンスを即応的に生成することで、シーケンス最適化において大きな可能性を秘めている。
論文 参考訳(メタデータ) (2025-02-11T05:39:49Z) - Gene Regulatory Network Inference in the Presence of Selection Bias and Latent Confounders [16.010515254476626]
選択はユビキタスであり、無視されたり、真の規則と混同されたりすると、因果解釈の欠陥や誤った介入勧告につながる可能性があることを示す。
本稿では、摂動データを利用して、真の遺伝子制御関係と、同値クラスへの選択と共役の非調節機構を明らかにするアルゴリズムであるGISLを提案する。
論文 参考訳(メタデータ) (2025-01-17T11:27:58Z) - Semantically Rich Local Dataset Generation for Explainable AI in Genomics [0.716879432974126]
ゲノム配列に基づいて訓練されたブラックボックス深層学習モデルは、異なる遺伝子制御機構の結果を予測するのに優れている。
本稿では、遺伝的プログラミングを用いて、その意味的多様性に寄与する配列の摂動を進化させることによりデータセットを生成することを提案する。
論文 参考訳(メタデータ) (2024-07-03T10:31:30Z) - Predicting Genetic Mutation from Whole Slide Images via Biomedical-Linguistic Knowledge Enhanced Multi-label Classification [119.13058298388101]
遺伝子変異予測性能を向上させるため,生物知識を付加したPathGenomic Multi-label Transformerを開発した。
BPGTはまず、2つの慎重に設計されたモジュールによって遺伝子前駆体を構成する新しい遺伝子エンコーダを確立する。
BPGTはその後ラベルデコーダを設計し、最終的に2つの調整されたモジュールによる遺伝的突然変異予測を行う。
論文 参考訳(メタデータ) (2024-06-05T06:42:27Z) - FGBERT: Function-Driven Pre-trained Gene Language Model for Metagenomics [46.189419603576084]
FGBERTは、タンパク質に基づく遺伝子表現を文脈認識トークン化剤として利用する、新しいメダゲノミクス事前訓練モデルである。
これは、遺伝子、機能、細菌、環境レベルにまたがる4つのレベルでのメダゲノミクスデータセットに優れた性能を示す。
論文 参考訳(メタデータ) (2024-02-24T13:13:17Z) - Multi-modal Self-supervised Pre-training for Regulatory Genome Across
Cell Types [75.65676405302105]
我々は、GeneBERTと呼ばれる、多モードかつ自己管理的な方法でゲノムデータを事前学習するための、単純かつ効果的なアプローチを提案する。
我々はATAC-seqデータセットで1700万のゲノム配列でモデルを事前訓練する。
論文 参考訳(メタデータ) (2021-10-11T12:48:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。