論文の概要: Central Dogma Transformer II: An AI Microscope for Understanding Cellular Regulatory Mechanisms
- arxiv url: http://arxiv.org/abs/2602.08751v1
- Date: Mon, 09 Feb 2026 14:54:31 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-10 20:26:25.309144
- Title: Central Dogma Transformer II: An AI Microscope for Understanding Cellular Regulatory Mechanisms
- Title(参考訳): Central Dogma Transformer II: 細胞調節機構を理解するためのAI顕微鏡
- Authors: Nobuyuki Ota,
- Abstract要約: 注意図を直接規制構造として解釈できる「AI顕微鏡」CDT-IIを提案する。
中央のドグマをその構造に反映することにより、それぞれの注意機構は特定の生物学的関係に対応する。
K562 CRISPRiデータの適用により、CDT-IIは摂動効果を予測し、監督なしでGFI1B規制ネットワークを回復する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Current biological AI models lack interpretability -- their internal representations do not correspond to biological relationships that researchers can examine. Here we present CDT-II, an "AI microscope" whose attention maps are directly interpretable as regulatory structure. By mirroring the central dogma in its architecture, each attention mechanism corresponds to a specific biological relationship: DNA self-attention for genomic relationships, RNA self-attention for gene co-regulation, and DNA-to-RNA cross-attention for transcriptional control. Using only genomic embeddings and raw per-cell expression, CDT-II enables experimental biologists to observe regulatory networks in their own data. Applied to K562 CRISPRi data, CDT-II predicts perturbation effects (per-gene mean $r = 0.84$) and recovers the GFI1B regulatory network without supervision (6.6-fold enrichment, $P = 3.5 \times 10^{-17}$). Two distinct attention mechanisms converge on an RNA processing module ($P = 1 \times 10^{-16}$). CDT-II establishes mechanism-oriented AI as an alternative to task-oriented approaches, revealing regulatory structure rather than merely optimizing predictions.
- Abstract(参考訳): 現在の生物学的AIモデルは解釈可能性に欠けており、その内部表現は研究者が検証できる生物学的関係に対応していない。
ここでは、注意マップを直接規制構造として解釈できる「AI顕微鏡」CDT-IIを提案する。
中央のドグマをその構造に反映することにより、それぞれの注意機構は特定の生物学的関係、ゲノム関係に対するDNAの自己認識、遺伝子共調節のためのRNAの自己認識、転写制御のためのDNA-to-RNAの相互認識に対応する。
CDT-IIは、ゲノム埋め込みと細胞ごとの生の発現のみを用いて、実験生物学者が自身のデータの中で規制ネットワークを観察することを可能にする。
K562 CRISPRiデータに適用すると、CDT-IIは摂動効果(per-gene mean $r = 0.84$)を予測し、監督なしでGFI1B規制ネットワークを回復する(6.6-fold Enrichment, $P = 3.5 \times 10^{-17}$)。
2つの異なる注意機構がRNA処理モジュール(P = 1 \times 10^{-16}$)に収束する。
CDT-IIは、タスク指向アプローチの代替としてメカニズム指向AIを確立し、単に予測を最適化するのではなく、規制構造を明らかにする。
関連論文リスト
- Central Dogma Transformer: Towards Mechanism-Oriented AI for Cellular Understanding [0.0]
本稿では,DNA,RNA,タンパク質の事前学習言語モデルを統合するアーキテクチャであるCentral Dogma Transformer(CDT)を紹介する。
我々は, K562細胞のCRISPRiエンハンサー摂動データに対するCDT v1の有効性を検証し, Pearson相関を0.503。
これらの結果から,生物情報の流れに沿ったAIアーキテクチャは,予測精度と機械的解釈可能性の両方を達成できることが示唆された。
論文 参考訳(メタデータ) (2026-01-03T06:29:22Z) - Tensor Network based Gene Regulatory Network Inference for Single-Cell Transcriptomic Data [0.0]
本研究では、テンソルネットワーク(TN)を利用して表現データを最適にマッピングする量子インスピレーションフレームワークを提案する。
遺伝子依存を定量化し、置換試験により統計的意義を確立する。
量子物理学にインスパイアされた手法と計算生物学を融合することにより,遺伝子制御に関する新たな知見を提供する。
論文 参考訳(メタデータ) (2025-09-08T17:11:12Z) - A scalable gene network model of regulatory dynamics in single cells [88.48246132084441]
本稿では,遺伝子ネットワーク構造を結合微分方程式に組み込んで,遺伝子制御関数をモデル化する機能的学習可能モデルFLeCSを提案する。
FLeCS は (pseudo) 時系列の単一セルデータから, セルの動態を正確に推定する。
論文 参考訳(メタデータ) (2025-03-25T19:19:21Z) - Regulatory DNA sequence Design with Reinforcement Learning [56.20290878358356]
本稿では,強化学習を利用して事前学習した自己回帰モデルを微調整する生成手法を提案する。
2つの酵母培地条件下でのプロモーター設計タスクの評価と,3種類のヒト細胞に対するエンハンサー設計タスクの評価を行った。
論文 参考訳(メタデータ) (2025-03-11T02:33:33Z) - GENERator: A Long-Context Generative Genomic Foundation Model [66.46537421135996]
本稿では,98k塩基対 (bp) と1.2Bパラメータからなるゲノム基盤モデル GENERator を提案する。
DNAの386Bbpからなる拡張データセットに基づいて、GENERatorは、確立されたベンチマークと新しく提案されたベンチマークの両方で最先端のパフォーマンスを実証する。
また、特に特定のアクティビティプロファイルを持つエンハンサーシーケンスを即応的に生成することで、シーケンス最適化において大きな可能性を秘めている。
論文 参考訳(メタデータ) (2025-02-11T05:39:49Z) - scCDCG: Efficient Deep Structural Clustering for single-cell RNA-seq via Deep Cut-informed Graph Embedding [23.163052968111103]
scCDCG (Single-cell RNA-seq Clustering via Deep Cut-informed Graph)は、cRNA-seqデータの効率的かつ正確なクラスタリングを目的とした新しいフレームワークである。
scCDCGは3つの主要な構成要素から構成される: (i) 細胞間高次構造情報を効果的にキャプチャするディープカットインフォームド技術を利用したグラフ埋め込みモジュール。
(II)cRNA-seqデータの特異な複雑さに対応するため,最適なトランスポートによって誘導される自己教師型学習モジュール。
論文 参考訳(メタデータ) (2024-04-09T09:46:17Z) - Multi-modal Self-supervised Pre-training for Regulatory Genome Across
Cell Types [75.65676405302105]
我々は、GeneBERTと呼ばれる、多モードかつ自己管理的な方法でゲノムデータを事前学習するための、単純かつ効果的なアプローチを提案する。
我々はATAC-seqデータセットで1700万のゲノム配列でモデルを事前訓練する。
論文 参考訳(メタデータ) (2021-10-11T12:48:44Z) - An Integrated Deep Learning and Dynamic Programming Method for
Predicting Tumor Suppressor Genes, Oncogenes, and Fusion from PDB Structures [0.0]
プロトオンコジーン(ONGO)の変異と腫瘍抑制遺伝子(TSG)の制御機能の欠如は、腫瘍増殖を制御していない一般的なメカニズムである。
計算研究を通じてONGOやTSGに関連する遺伝子機能の可能性を見つけることは、疾患を標的とする薬物の開発に役立てることができる。
本稿では,入力された3dタンパク質構造情報から特徴地図集合を抽出する前処理段階から開始する分類法を提案する。
論文 参考訳(メタデータ) (2021-05-17T18:18:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。