論文の概要: Ctrl-DNA: Controllable Cell-Type-Specific Regulatory DNA Design via Constrained RL
- arxiv url: http://arxiv.org/abs/2505.20578v1
- Date: Mon, 26 May 2025 23:27:50 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-28 17:05:58.318356
- Title: Ctrl-DNA: Controllable Cell-Type-Specific Regulatory DNA Design via Constrained RL
- Title(参考訳): Ctrl-DNA:制御可能な細胞型特異的レギュレーションDNA設計
- Authors: Xingyu Chen, Shihao Ma, Runsheng Lin, Jiecong Lin, Bo Wang,
- Abstract要約: Ctrl-DNAは、制御可能な細胞型特異性を持つ制御DNA配列の設計に適した、制約付き強化学習フレームワークである。
ヒトプロモーターとエンハンサーの評価は、Ctrl-DNAが既存の生成的およびRLベースのアプローチより一貫して優れていることを示す。
- 参考スコア(独自算出の注目度): 17.05124539734196
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Designing regulatory DNA sequences that achieve precise cell-type-specific gene expression is crucial for advancements in synthetic biology, gene therapy and precision medicine. Although transformer-based language models (LMs) can effectively capture patterns in regulatory DNA, their generative approaches often struggle to produce novel sequences with reliable cell-specific activity. Here, we introduce Ctrl-DNA, a novel constrained reinforcement learning (RL) framework tailored for designing regulatory DNA sequences with controllable cell-type specificity. By formulating regulatory sequence design as a biologically informed constrained optimization problem, we apply RL to autoregressive genomic LMs, enabling the models to iteratively refine sequences that maximize regulatory activity in targeted cell types while constraining off-target effects. Our evaluation on human promoters and enhancers demonstrates that Ctrl-DNA consistently outperforms existing generative and RL-based approaches, generating high-fitness regulatory sequences and achieving state-of-the-art cell-type specificity. Moreover, Ctrl-DNA-generated sequences capture key cell-type-specific transcription factor binding sites (TFBS), short DNA motifs recognized by regulatory proteins that control gene expression, demonstrating the biological plausibility of the generated sequences.
- Abstract(参考訳): 細胞型特異的な遺伝子発現を正確に達成する調節DNA配列を設計することは、合成生物学、遺伝子治療、精密医療の進歩に不可欠である。
トランスフォーマーベースの言語モデル(LM)は、制御DNAのパターンを効果的に捉えることができるが、その生成アプローチは、しばしば、信頼できる細胞特異的な活性を持つ新しい配列を生成するのに苦労する。
本稿では,制御可能な細胞型特異性を持つ制御DNA配列の設計に適した,制約付き強化学習(RL)フレームワークであるCtrl-DNAを紹介する。
生物情報に基づく制約付き最適化問題として規制シーケンス設計を定式化することにより、RLを自己回帰型ゲノミクスに応用し、ターゲット外効果を制約しながら標的細胞型における規制活性を最大化する配列を反復的に洗練する。
ヒトプロモーターとエンハンサーの評価は、Ctrl-DNAが既存の生成的およびRLベースのアプローチを一貫して上回り、高適合性制御配列を生成し、最先端の細胞型特異性を実現することを示す。
さらに、Ctrl-DNA生成配列は、キー細胞型特異的転写因子結合部位(TFBS)を捕捉し、遺伝子発現を制御する調節タンパク質によって認識される短いDNAモチーフを捕捉し、生成された配列の生物学的妥当性を示す。
関連論文リスト
- Regulatory DNA sequence Design with Reinforcement Learning [56.20290878358356]
本稿では,強化学習を利用して事前学習した自己回帰モデルを微調整する生成手法を提案する。
2つの酵母培地条件下でのプロモーター設計タスクの評価と,3種類のヒト細胞に対するエンハンサー設計タスクの評価を行った。
論文 参考訳(メタデータ) (2025-03-11T02:33:33Z) - HybriDNA: A Hybrid Transformer-Mamba2 Long-Range DNA Language Model [70.69095062674944]
ハイブリッドトランスフォーマー-マンバ2アーキテクチャを組み込んだデコーダのみのDNA言語モデルであるHybriDNAを提案する。
このハイブリッド設計により、HybriDNAはDNA配列を最大131kbまで効率よく単一のヌクレオチド分解能で処理できる。
HybriDNAは、BEND、GUE、LRBベンチマークから算出された33のDNA理解データセットにまたがる最先端のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2025-02-15T14:23:43Z) - GENERator: A Long-Context Generative Genomic Foundation Model [66.46537421135996]
本稿では,98k塩基対 (bp) と1.2Bパラメータからなるゲノム基盤モデル GENERator を提案する。
DNAの386Bbpからなる拡張データセットに基づいて、GENERatorは、確立されたベンチマークと新しく提案されたベンチマークの両方で最先端のパフォーマンスを実証する。
また、特に特定のアクティビティプロファイルを持つエンハンサーシーケンスを即応的に生成することで、シーケンス最適化において大きな可能性を秘めている。
論文 参考訳(メタデータ) (2025-02-11T05:39:49Z) - DART-Eval: A Comprehensive DNA Language Model Evaluation Benchmark on Regulatory DNA [2.543784712990392]
大規模なゲノムDNA言語モデル(DNALM)は、多様なDNA要素の一般化可能な表現を学習することを目的としている。
本ベンチマークでは, 機能的配列の特徴探索, 細胞型特異的制御活性の予測, 遺伝的変異の影響の予測など, 生物学的に有意義な下流課題を対象としている。
論文 参考訳(メタデータ) (2024-12-06T21:23:35Z) - DiscDiff: Latent Diffusion Model for DNA Sequence Generation [4.946462450157714]
本稿では, 離散的なDNA配列を生成するための遅延拡散モデルであるDisdisDiffと, これらの配列を洗練するためのポストトレーニングアルゴリズムであるAbsorb-Escapeを紹介する。
EPD-GenDNAは15種から16万のユニークな配列を含む、DNA生成のための最初の包括的で多種のデータセットである。
本研究は,遺伝子治療やタンパク質生産に影響を及ぼす可能性のあるDNA生成モデルの構築を期待する。
論文 参考訳(メタデータ) (2024-02-08T22:06:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。