論文の概要: GenCircuit-RL: Reinforcement Learning from Hierarchical Verification for Genetic Circuit Design
- arxiv url: http://arxiv.org/abs/2605.14215v1
- Date: Thu, 14 May 2026 00:18:09 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-15 21:45:34.548801
- Title: GenCircuit-RL: Reinforcement Learning from Hierarchical Verification for Genetic Circuit Design
- Title(参考訳): GenCircuit-RL:遺伝的回路設計のための階層的検証による強化学習
- Authors: Noah Flynn,
- Abstract要約: 我々は階層的検証報酬に基づいて構築された強化学習フレームワークであるGenCircuit-RLを紹介する。
また、SynBio-Reasonは、6つの標準回路タイプと9つのタスクにまたがる4,753個の回路のベンチマークである。
得られたモデルは、トポロジカルに正しい回路を生成し、新しい生物学的部分に一般化し、合成生物学文献から標準設計を再発見する。
- 参考スコア(独自算出の注目度): 0.023074632109535153
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Genetic circuit design remains a laborious, expert-driven process despite decades of progress in synthetic biology. We study this problem through code generation: models produce Python code in pysbol3 to construct genetic circuits in the Synthetic Biology Open Language (SBOL), a formal representation that supports automated verification. We introduce GenCircuit-RL, a reinforcement learning framework built around hierarchical verification rewards that decompose correctness into five levels, from code execution to task-specific topological checks, and a four-stage curriculum that shifts optimization pressure from code generation to functional reasoning. We also introduce SynBio-Reason, a benchmark of 4,753 circuits spanning six canonical circuit types and nine tasks from code repair to de novo design, with held-out biological parts for out-of-distribution evaluation. Hierarchical verification improves task success on functional reasoning tasks by 14 to 16 percentage points over binary rewards, and curriculum learning is required for strong design performance. The resulting models generate topologically correct circuits, generalize to novel biological parts, and rediscover canonical designs from the synthetic biology literature.
- Abstract(参考訳): 遺伝回路設計は、数十年にわたる合成生物学の進歩にもかかわらず、つらい専門家主導のプロセスのままである。
モデルはPythonコードをpysbol3で生成し、自動検証をサポートする形式的表現であるSBOL(Synthetic Biology Open Language)に遺伝的回路を構築する。
GenCircuit-RLは、コード実行からタスク固有のトポロジカルチェックまでの正当性を5段階に分解する階層的検証報酬に基づいて構築された強化学習フレームワークであり、コード生成から機能的推論へ最適化圧力をシフトする4段階のカリキュラムである。
SynBio-Reasonは、6種類の標準回路タイプと9つのタスクにまたがる4,753個の回路のベンチマークであり、コード修復からデ・ノボ設計までの9つのタスクと、配布外評価のための保留された生物学的部品も導入する。
階層的検証は、機能的推論タスクにおけるタスク成功を二進的な報酬よりも14~16ポイント改善し、強力な設計性能にはカリキュラム学習が必要である。
得られたモデルは、トポロジカルに正しい回路を生成し、新しい生物学的部分に一般化し、合成生物学文献から標準設計を再発見する。
関連論文リスト
- Language Models for Controllable DNA Sequence Design [41.74647005781059]
制御可能生成のための自動変圧器発電機ATGC-Genを紹介する。
ATGC-Genはデコーダのみとエンコーダのみのトランスフォーマーアーキテクチャでインスタンス化されている。
我々の実験はATGC-Genが、流動的で多様性があり、生物学的に関係のある配列を生成できることを実証した。
論文 参考訳(メタデータ) (2025-07-19T06:23:17Z) - Regulatory DNA sequence Design with Reinforcement Learning [56.20290878358356]
本稿では,強化学習を利用して事前学習した自己回帰モデルを微調整する生成手法を提案する。
2つの酵母培地条件下でのプロモーター設計タスクの評価と,3種類のヒト細胞に対するエンハンサー設計タスクの評価を行った。
論文 参考訳(メタデータ) (2025-03-11T02:33:33Z) - Genetic Instruct: Scaling up Synthetic Generation of Coding Instructions for Large Language Models [59.60208063956459]
大規模言語モデル(LLM)は、効果的なアライメントのために高品質な命令データを必要とする。
本稿では,大規模かつ高品質な符号化命令を合成するスケーラブルなアルゴリズムであるGenematic-Instructを提案する。
論文 参考訳(メタデータ) (2024-07-29T20:42:59Z) - VQDNA: Unleashing the Power of Vector Quantization for Multi-Species Genomic Sequence Modeling [60.91599380893732]
VQDNAは、ゲノムボキャブラリ学習の観点からゲノムのトークン化を改良する汎用フレームワークである。
ベクトル量子化されたコードブックを学習可能な語彙として活用することにより、VQDNAはゲノムをパターン認識の埋め込みに適応的にトークン化することができる。
論文 参考訳(メタデータ) (2024-05-13T20:15:03Z) - Boolean matrix logic programming for active learning of gene functions in genome-scale metabolic network models [4.762323642506732]
ゲノムスケールの代謝ネットワークモデル(GEM)は、生物学的システムの遺伝子工学を評価するために広く用いられている。
GEMは、主に遺伝子相互作用の不完全なアノテーションのために、遺伝子組み換え細胞の振る舞いを正確に予測できないことが多い。
我々は、費用対効果実験をガイドし、解釈可能な論理プログラムを用いて、モデル細菌の最先端GEMを符号化する新しいシステム、BMLP_active$を開発する。
論文 参考訳(メタデータ) (2024-05-10T09:51:06Z) - CodeRL: Mastering Code Generation through Pretrained Models and Deep
Reinforcement Learning [92.36705236706678]
CodeRLは、事前訓練されたLMと深層強化学習によるプログラム合成タスクのための新しいフレームワークである。
推論中、我々は重要なサンプリング戦略を持つ新しい生成手順を導入する。
モデルバックボーンについては,CodeT5のエンコーダデコーダアーキテクチャを拡張し,学習目標を拡張した。
論文 参考訳(メタデータ) (2022-07-05T02:42:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。