論文の概要: Curriculum-Augmented GFlowNets For mRNA Sequence Generation
- arxiv url: http://arxiv.org/abs/2510.03811v1
- Date: Sat, 04 Oct 2025 13:41:14 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-07 16:52:59.26819
- Title: Curriculum-Augmented GFlowNets For mRNA Sequence Generation
- Title(参考訳): mRNA配列生成のためのカリキュラム強化GFlowNet
- Authors: Aya Laajil, Abduragim Shtanchaev, Sajan Muhammad, Eric Moulines, Salem Lahlou,
- Abstract要約: 本稿では,多目的GFlowNetとカリキュラム学習を統合し,デノボmRNA配列を生成するカリキュラム拡張GFlowNetを提案する。
また、GFlowNetsの新しいmRNA設計環境を提供することにより、標的タンパク質配列と生物学的目的の組み合わせが与えられ、プラウシブルmRNA候補を生成するモデルのトレーニングが可能になる。
- 参考スコア(独自算出の注目度): 21.487360156680605
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Designing mRNA sequences is a major challenge in developing next-generation therapeutics, since it involves exploring a vast space of possible nucleotide combinations while optimizing sequence properties like stability, translation efficiency, and protein expression. While Generative Flow Networks are promising for this task, their training is hindered by sparse, long-horizon rewards and multi-objective trade-offs. We propose Curriculum-Augmented GFlowNets (CAGFN), which integrate curriculum learning with multi-objective GFlowNets to generate de novo mRNA sequences. CAGFN integrates a length-based curriculum that progressively adapts the maximum sequence length guiding exploration from easier to harder subproblems. We also provide a new mRNA design environment for GFlowNets which, given a target protein sequence and a combination of biological objectives, allows for the training of models that generate plausible mRNA candidates. This provides a biologically motivated setting for applying and advancing GFlowNets in therapeutic sequence design. On different mRNA design tasks, CAGFN improves Pareto performance and biological plausibility, while maintaining diversity. Moreover, CAGFN reaches higher-quality solutions faster than a GFlowNet trained with random sequence sampling (no curriculum), and enables generalization to out-of-distribution sequences.
- Abstract(参考訳): 安定性、翻訳効率、タンパク質発現などの配列特性を最適化しながら、可能なヌクレオチドの組み合わせの広大な空間を探索することを含むため、mRNA配列の設計は次世代の治療薬の開発において大きな課題である。
Generative Flow Networksはこのタスクに期待していますが、トレーニングはスパース、ロングホライゾンの報酬、多目的トレードオフによって妨げられています。
本稿では,多目的GFlowNetとカリキュラム学習を統合し,デノボmRNA配列を生成するCurriculum-Augmented GFlowNets (CAGFN)を提案する。
CAGFNは、より簡単なサブプロブレムからより難しいサブプロブレムへの探索を導く最大シーケンス長を徐々に適応させる長さベースのカリキュラムを統合している。
また、GFlowNetsの新しいmRNA設計環境を提供することにより、標的タンパク質配列と生物学的目的の組み合わせが与えられ、プラウシブルmRNA候補を生成するモデルのトレーニングが可能になる。
これは、治療シーケンス設計にGFlowNetを適用して前進するための生物学的に動機付けられた設定を提供する。
異なるmRNA設計タスクにおいて、CAGFNは多様性を維持しながらパレート性能と生物学的妥当性を改善している。
さらに、CAGFNは、ランダムなシーケンスサンプリング(カリキュラムなし)で訓練されたGFlowNetよりも高速に高品質なソリューションに到達し、アウト・オブ・ディストリビューションシーケンスへの一般化を可能にする。
関連論文リスト
- A New Deep-learning-Based Approach For mRNA Optimization: High Fidelity, Computation Efficiency, and Multiple Optimization Factors [12.26159226306187]
我々は,mRNA最適化のための新しい深層学習手法である textbfRNop を紹介する。
我々は,300万以上のシーケンスを含む大規模データセットを収集し,GPLoss,CAILoss,tAILoss,MFELossという4つの特別な損失関数を設計する。
RNopはハイシークエンスを保証し、47.32シークエンス/秒までの計算スループットを実現し、最適化されたmRNAシークエンスを生成する。
論文 参考訳(メタデータ) (2025-05-29T08:21:11Z) - Regulatory DNA sequence Design with Reinforcement Learning [56.20290878358356]
本稿では,強化学習を利用して事前学習した自己回帰モデルを微調整する生成手法を提案する。
2つの酵母培地条件下でのプロモーター設計タスクの評価と,3種類のヒト細胞に対するエンハンサー設計タスクの評価を行った。
論文 参考訳(メタデータ) (2025-03-11T02:33:33Z) - Life-Code: Central Dogma Modeling with Multi-Omics Sequence Unification [55.98854157265578]
Life-Codeは、様々な生物学的機能にまたがる包括的なフレームワークである。
本稿では、RNAを逆転写し、アミノ酸をヌクレオチド配列に変換することで、マルチオミクスデータを統合する統一パイプラインを提案する。
Life-Codeは3つのオミクスにまたがる様々なタスクの最先端の結果を達成し、マルチオミクス分析と解釈の進歩の可能性を強調している。
論文 参考訳(メタデータ) (2025-02-11T06:53:59Z) - RNACG: A Universal RNA Sequence Conditional Generation model based on Flow-Matching [0.0]
本稿では,フローマッチングに基づくRNA配列設計のための汎用フレームワークであるRNACG(RNA Generator)を提案する。
1つのフレームワークでシーケンス生成を統一することにより、RNACGは複数のRNA設計パラダイムの統合を可能にする。
論文 参考訳(メタデータ) (2024-07-29T09:46:46Z) - Dynamic Backtracking in GFlowNets: Enhancing Decision Steps with Reward-Dependent Adjustment Mechanisms [15.232212376437024]
本稿では,新規なGFN, Dynamic Backtracking GFN(DB-GFN)を提案する。
DB-GFNは、現在の状態の報酬値に応じて、ネットワーク構築プロセス中のバックトラックを可能にする。
LS-GFNやGTBなどのGFNモデルよりも、サンプル品質、サンプル探索量、トレーニング収束速度が優れている。
論文 参考訳(メタデータ) (2024-04-08T14:52:48Z) - Pre-Training and Fine-Tuning Generative Flow Networks [61.90529626590415]
本稿では,GFlowNetの報酬なし事前学習のための新しいアプローチを提案する。
自己指導型問題としてトレーニングをフレーミングすることで,候補空間の探索を学習する結果条件付きGFlowNetを提案する。
事前学習したOC-GFNモデルにより、下流タスクにおける新しい報酬関数をサンプリングできるポリシーを直接抽出できることを示す。
論文 参考訳(メタデータ) (2023-10-05T09:53:22Z) - Trajectory balance: Improved credit assignment in GFlowNets [63.687669765579585]
従来提案したGFlowNetの学習目標,フローマッチング,詳細なバランスは,長いアクションシーケンスをまたいだ非効率な信用伝播の傾向が示唆された。
本稿では,GFlowNetsの新しい学習目標であるトラジェクトリバランスを,従来使用されていた目的に対して,より効率的な代替手段として提案する。
4つの異なる領域の実験において、GFlowNet収束のための軌道バランス目標の利点、生成されたサンプルの多様性、長いアクションシーケンスや大きなアクション空間に対する堅牢性を実証的に実証した。
論文 参考訳(メタデータ) (2022-01-31T14:07:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。