論文の概要: Flexible Flows for Biological Sequence Design
- arxiv url: http://arxiv.org/abs/2606.10543v1
- Date: Tue, 09 Jun 2026 08:11:14 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-10 15:40:58.384401
- Title: Flexible Flows for Biological Sequence Design
- Title(参考訳): 生体配列設計のためのフレキシブルフロー
- Authors: Yogesh Verma, Dani Korpela, Harri Lähdesmäki, Vikas Garg,
- Abstract要約: 本稿では,シーケンス要素間のドメイン固有の嗜好を符号化し,フロー目標やトレーニング手順を変更することなく,ソース分布を可視領域に偏在させる構造結合を提案する。
本稿では,連続潜時空間で連続的に生成する潜在分類器フリー誘導機構と,編集操作に対するテスト時間制御のためのディリクレ事前温度スケーリングを導入する。
本手法は, 密度推定, 非条件および条件付きDNA配列生成, ペプチド配列生成など, 多様な生物配列タスクにおける最先端性能を実現する。
- 参考スコア(独自算出の注目度): 32.53604513116057
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Designing functional biological sequences requires navigating vast discrete spaces under strict evolutionary and biophysical constraints. Discrete Flow Matching (DFM) offers a generative framework over such spaces, but existing approaches rely on biologically uninformative couplings and offer limited flexibility for variable-length sequence generation and fine-grained control. We propose a structured coupling that encodes domain-specific preferences among sequence elements, biasing the source distribution toward plausible regions without modifying the flow objective or training procedure. Building on this, we introduce a latent edit-based rate parameterization that models variable-length generation via edit operations conditioned on a shared global latent, akin to a latent variable model, while remaining tractable. We further introduce a latent classifier-free guidance mechanism that steers generation coherently in continuous latent space, along with Dirichlet-prior temperature scaling for test-time control over edit operations. Our method achieves state-of-the-art performance across diverse biological sequence tasks, including density estimation, unconditional and conditional DNA sequence generation, and peptide sequence generation.
- Abstract(参考訳): 機能的生物学的配列を設計するには、厳密な進化的および生物学的な制約の下で広大な離散空間をナビゲートする必要がある。
離散フローマッチング(DFM)はそのような空間上の生成フレームワークを提供するが、既存のアプローチは生物学的に非形式的な結合に依存し、可変長シーケンスの生成ときめ細かい制御に制限のある柔軟性を提供する。
本稿では,シーケンス要素間のドメイン固有の嗜好を符号化し,フロー目標やトレーニング手順を変更することなく,ソース分布を可視領域に偏在させる構造結合を提案する。
これに基づいて、我々は、潜在変数モデルと同様に、共有グローバル潜在子に条件付けされた編集操作により、可変長生成をモデル化し、トラクタブルなまま、潜時編集ベースのレートパラメータ化を導入する。
さらに、連続潜伏空間で連続的に生成する潜在分類器フリー誘導機構と、編集操作に対するテスト時間制御のためのディリクレ事前温度スケーリングを導入する。
本手法は, 密度推定, 非条件および条件付きDNA配列生成, ペプチド配列生成など, 多様な生物配列タスクにおける最先端性能を実現する。
関連論文リスト
- Towards A Generative Protein Evolution Machine with DPLM-Evo [73.57855006698269]
本報告では,denoising中の置換,挿入,削除操作を明示的に予測する進化的離散拡散フレームワークDPLM-Evoについて述べる。
DPLM-Evoは、単一シーケンス設定におけるProteinGymのシーケンス理解と最先端の突然変異効果予測性能を改善した。
論文 参考訳(メタデータ) (2026-04-30T19:59:07Z) - Minimal-Action Discrete Schrödinger Bridge Matching for Peptide Sequence Design [1.063850381314547]
我々は、ペプチド設計のためのレートベース生成フレームワークとして、ミニマルアクション離散型Schrdinger Bridge Matching (MadSBM)を導入した。
MadSBMはアミノ酸編集グラフ上での連続的マルコフ過程の制御として生成を定式化する。
我々は,MadSBMサンプリングの特定の目的に向けてのガイダンスを導入し,治療ペプチドの設計空間を拡大した。
論文 参考訳(メタデータ) (2026-01-29T23:38:36Z) - Simulating Distribution Dynamics: Liquid Temporal Feature Evolution for Single-Domain Generalized Object Detection [58.25418970608328]
Single-Domain Generalized Object Detection (Single-DGOD)は、あるソースドメインで訓練された検出器を複数の未知のドメインに転送することを目的としている。
シングルDGODの既存の方法は通常、データの多様性を拡大するために離散的なデータ拡張や静的摂動法に依存している。
そこで本研究では,ソース領域から潜伏分布のシミュレーションに至るまでの機能の進化をシミュレートする手法を提案する。
論文 参考訳(メタデータ) (2025-11-13T03:10:39Z) - SURGIN: SURrogate-guided Generative INversion for subsurface multiphase flow with quantified uncertainty [9.423344821042933]
SURrogate-guided Generative Inversion framework for assimilation multiphase flow data。
SurGINはゼロショット条件生成機能を備えており、タスク固有のリトレーニングなしで、目に見えない監視データのリアルタイム同化を可能にする。
代用誘導ベイズ推論による生成学習を統一することにより、SURGINはパラメトリック汎函数空間における逆フローモデリングと不確実性定量化のための新しいパラダイムを確立する。
論文 参考訳(メタデータ) (2025-09-16T15:42:22Z) - Multi-Objective-Guided Discrete Flow Matching for Controllable Biological Sequence Design [5.64033072458324]
我々は,事前学習した離散フローマッチングジェネレータを操る汎用フレームワークであるMulti-Objective-Guided Discrete Flow Matching (MOG-DFM)を提案する。
各サンプリングステップにおいて、MOG-DFMは、候補遷移のためのハイブリッドランク方向スコアを算出する。
また, 各種ペプチド生成のためのPepDFM, 機能増強剤DNA生成のためのEnhancerDFMの2つの非条件離散フローマッチングモデルを訓練した。
論文 参考訳(メタデータ) (2025-05-11T18:17:44Z) - Constrained Discrete Diffusion [61.81569616239755]
本稿では,拡散過程における微分可能制約最適化の新たな統合であるCDD(Constrained Discrete Diffusion)を紹介する。
CDDは直接、離散拡散サンプリングプロセスに制約を課し、トレーニング不要で効果的なアプローチをもたらす。
論文 参考訳(メタデータ) (2025-03-12T19:48:12Z) - UniGenX: a unified generative foundation model that couples sequence, structure and function to accelerate scientific design across proteins, molecules and materials [62.72989417755985]
自然系における関数の統一生成モデルUniGenXを提案する。
UniGenXはシンボルトークンと数値トークンの混合ストリームとして異種入力を表す。
ドメイン間のファンクション・アウェア・ジェネレーションに対して、最先端または競合的なパフォーマンスを達成する。
論文 参考訳(メタデータ) (2025-03-09T16:43:07Z) - Multi-Modal and Multi-Attribute Generation of Single Cells with CFGen [76.02070962797794]
本研究では、単一セルデータ固有の離散性を保存するフローベースの条件生成モデルであるCellFlow for Generation (CFGen)を紹介する。
CFGenは、全ゲノムマルチモーダル単一セルデータを確実に生成し、重要な生物学的データ特性の回復を改善する。
論文 参考訳(メタデータ) (2024-07-16T14:05:03Z) - Conditional Hybrid GAN for Sequence Generation [56.67961004064029]
本稿では,この問題を解決するための条件付きハイブリッドGAN(C-Hybrid-GAN)を提案する。
我々はGumbel-Softmax法を利用して離散値列の分布を近似する。
提案したC-Hybrid-GANは、文脈条件付き離散値シーケンス生成において既存の手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2020-09-18T03:52:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。