論文の概要: LPDP: Inference-Time Reward Control for Variable-Length DNA Generation with Edit Flows
- arxiv url: http://arxiv.org/abs/2605.11368v1
- Date: Tue, 12 May 2026 00:43:08 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-13 21:48:56.497679
- Title: LPDP: Inference-Time Reward Control for Variable-Length DNA Generation with Edit Flows
- Title(参考訳): LPDP: 編集フローを考慮した可変長DNA生成のための推論時間リワード制御
- Authors: Jeongchan Kim, Yunkyung Ko, Jong Chul Ye,
- Abstract要約: DNA配列生成のための推論時間報酬制御における最近の編集フローの適用について検討する。
本研究では, 可変長DNA編集動作生成器のための訓練不要, 中間状態, 動作対応の局所解法演算子であるローカル摂動離散プログラミング(LPDP)を提案する。
- 参考スコア(独自算出の注目度): 46.31041137012854
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We study the application of recent Edit Flows for inference-time reward control for DNA sequence generation. Unlike most reward-guided DNA generation frameworks, which operate on fixed-length sequence spaces, Edit Flows have a potential to generate variable-length DNA through biologically plausible insertion, deletion, and substitution operations. In particular, we propose Local Perturbation Discrete Programming (LPDP), a training-free, intermediate-state and action-aware local re-solving operator for variable-length DNA edit-action generators at inference time. More specifically, at each guided rollout step, LPDP scores one-step root edits, retains a near-best root band, and re-ranks each retained root by solving a bounded local discrete program around its child sequence. This local program uses the typed geometry of edit actions to focus on coherent substitution, insertion, or deletion subgraphs, and aggregates local continuations with either a hard Max backup or a soft log-sum-exponential (LSE) backup. We instantiate LPDP in two regimes: front-loaded reward tilting for enhancer optimization, where early edits are critical for establishing global regulatory sequence structure, and back-loaded reward tilting for exon-intron-exon inpainting, where late edits fine-tune splice-boundary contexts.
- Abstract(参考訳): DNA配列生成のための推論時間報酬制御における最近の編集フローの適用について検討する。
固定長配列空間で動作するほとんどの報酬誘導型DNA生成フレームワークとは異なり、編集フローは生物学的に妥当な挿入、削除、置換操作を通じて可変長DNAを生成する可能性がある。
特に, 可変長DNA編集動作生成のための訓練不要, 中間状態, 動作対応の局所再解決演算子であるローカル摂動離散プログラミング(LPDP)を提案する。
より具体的には、各ガイド付きロールアウトステップにおいて、LPDPはワンステップのルート編集を記録し、最寄りのルートバンドを保持し、それぞれの保持されたルートを、その子シーケンスの周囲に有界なローカル離散プログラムを解くことで再ランク付けする。
このローカルプログラムは、編集動作の型付き幾何学を用いて、コヒーレントな置換、挿入、削除のサブグラフに集中し、ハードマックスバックアップまたはソフトログサム指数(LSE)バックアップで局所的な継続を集約する。
LPDPは,早期編集がグローバルな規制配列の確立に不可欠であるエンハンサー最適化のための前装式報酬傾き,後方装式報酬傾きによるエキソン・イントロン・エキソン塗布のための後装式報酬傾き,細管スプライス境界コンテキストの編集を行う2つの方式でインスタンス化する。
関連論文リスト
- AdaExplore: Failure-Driven Adaptation and Diversity-Preserving Search for Efficient Kernel Generation [59.964989458924585]
AdaExploreは、パフォーマンスクリティカルなカーネルコード生成のための蓄積された実行フィードバックによる自己改善を可能にするエージェントフレームワークである。
適応段階では、エージェントはタスクを合成し、繰り返し発生する障害を有効ルールの再利用可能なメモリに変換する。
探索段階では、候補核を木として整理し、小さな局所精製とより大きな構造再生を交互に行う。
論文 参考訳(メタデータ) (2026-04-17T18:25:03Z) - TopoEdit: Fast Post-Optimization Editing of Topology Optimized Structures [6.670146926866281]
TopoEditは、物理学を意識したエンジニアリング編集のための高速なポスト最適化エディタである。
最適化トポロジが与えられた後、TopoEditはそれをOATの空間ラテントにエンコードする。
TopoEditは、編集された候補をサンプル毎に秒以下の拡散時間で生成する。
論文 参考訳(メタデータ) (2026-02-25T21:41:44Z) - PRISM: Parallel Residual Iterative Sequence Model [52.26239951489612]
我々はこの緊張を解決するためにPRISM(Parallel Residual Iterative Sequence Model)を提案する。
PRISMは、パラレル化可能な形で多段階精製の重要な構造特性を捉える、ソルバに着想を得た帰納バイアスを導入している。
この定式化が Rank-$L$ の蓄積を達成することを証明し、更新多様体を単一ステップの Rank-$1$ ボトルネックを超えて構造的に拡張する。
論文 参考訳(メタデータ) (2026-02-11T12:39:41Z) - Zonkey: A Hierarchical Diffusion Language Model with Differentiable Tokenization and Probabilistic Attention [0.0]
Zonkeyは階層的な拡散モデルであり、生文字から文書レベルの表現まで、完全にトレーニング可能なパイプラインを通じて制限に対処する。
コアとなるのは、確率的開始順序(BOS)決定を学習する、差別化可能なトークンである。
Zonkeyは、ノイズからコヒーレントで可変長のテキストを生成し、創発的な階層を示す。
論文 参考訳(メタデータ) (2026-01-29T14:17:37Z) - Beyond Hard Writes and Rigid Preservation: Soft Recursive Least-Squares for Lifelong LLM Editing [16.768713543557443]
モデル編集は、関係のない振る舞いを保持しながら、再トレーニングすることなく、新しい事実やルールで事前訓練された更新を行う。
長い逐次編集のための最小二乗エディタ RLSEdit を提案する。
複数のモデルファミリの実験は、10K編集への安定したスケーリングを示し、編集成功と全体安定性の両方において強力なベースラインを達成している。
論文 参考訳(メタデータ) (2026-01-22T06:11:44Z) - Regulatory DNA sequence Design with Reinforcement Learning [56.20290878358356]
本稿では,強化学習を利用して事前学習した自己回帰モデルを微調整する生成手法を提案する。
2つの酵母培地条件下でのプロモーター設計タスクの評価と,3種類のヒト細胞に対するエンハンサー設計タスクの評価を行った。
論文 参考訳(メタデータ) (2025-03-11T02:33:33Z) - TAPIR: Learning Adaptive Revision for Incremental Natural Language
Understanding with a Two-Pass Model [14.846377138993645]
インクリメンタル処理のための最近のニューラルネットワークベースのアプローチは、主にRNNまたはTransformerを使用する。
より長い入力プレフィックスを繰り返し通過する再起動/インクリメンタルインターフェースは、部分的な出力を得るために使用でき、更新する機能を提供する。
本稿では、AdaPtIve Revision(TAPIR)の2パスモデルを提案し、適応的な修正ポリシーを学ぶための漸進的な監視信号を得る方法を提案する。
論文 参考訳(メタデータ) (2023-05-18T09:58:19Z) - Don't Take It Literally: An Edit-Invariant Sequence Loss for Text
Generation [109.46348908829697]
生成したn-gramのすべてのn-gramとの一致損失を計算した新しい編集不変シーケンス損失(EISL)を提案する。
ノイズの多いターゲットシーケンスを持つ機械翻訳,教師なしテキストスタイル転送,非自己回帰型機械翻訳の3つのタスクについて実験を行った。
論文 参考訳(メタデータ) (2021-06-29T03:59:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。