論文の概要: Multi-Objective-Guided Discrete Flow Matching for Controllable Biological Sequence Design
- arxiv url: http://arxiv.org/abs/2505.07086v1
- Date: Sun, 11 May 2025 18:17:44 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-13 20:21:49.202567
- Title: Multi-Objective-Guided Discrete Flow Matching for Controllable Biological Sequence Design
- Title(参考訳): 制御可能な生物学的シーケンス設計のための多目的離散フローマッチング
- Authors: Tong Chen, Yinuo Zhang, Sophia Tang, Pranam Chatterjee,
- Abstract要約: 本稿では,効率的なフローマッチングのためのフレームワークとして,多目的型離散フローマッチング(MOG-DFM)を提案する。
各サンプリングステップにおいて、MOG-DFMは、候補遷移に対するハイブリッドなランク方向スコアを計算し、適応的なハイパーコーンフィルタを適用して、一貫した多目的進行を強制する。
我々はMOG-DFMが5つの特性に最適化されたペプチド結合体を生成すること、および特定のエンハンサークラスとDNA形状を持つDNA配列を設計する上での有効性を実証した。
- 参考スコア(独自算出の注目度): 5.64033072458324
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Designing biological sequences that satisfy multiple, often conflicting, functional and biophysical criteria remains a central challenge in biomolecule engineering. While discrete flow matching models have recently shown promise for efficient sampling in high-dimensional sequence spaces, existing approaches address only single objectives or require continuous embeddings that can distort discrete distributions. We present Multi-Objective-Guided Discrete Flow Matching (MOG-DFM), a general framework to steer any pretrained discrete-time flow matching generator toward Pareto-efficient trade-offs across multiple scalar objectives. At each sampling step, MOG-DFM computes a hybrid rank-directional score for candidate transitions and applies an adaptive hypercone filter to enforce consistent multi-objective progression. We also trained two unconditional discrete flow matching models, PepDFM for diverse peptide generation and EnhancerDFM for functional enhancer DNA generation, as base generation models for MOG-DFM. We demonstrate MOG-DFM's effectiveness in generating peptide binders optimized across five properties (hemolysis, non-fouling, solubility, half-life, and binding affinity), and in designing DNA sequences with specific enhancer classes and DNA shapes. In total, MOG-DFM proves to be a powerful tool for multi-property-guided biomolecule sequence design.
- Abstract(参考訳): 複数の、しばしば矛盾し、機能的、生物学的な基準を満たす生物学的配列を設計することは、生体分子工学における中心的な課題である。
離散フローマッチングモデルは近年、高次元のシーケンス空間における効率的なサンプリングを約束しているが、既存のアプローチは単一の目的にのみ対処するか、離散分布を歪ませる連続的な埋め込みを必要とする。
多目的型離散フローマッチング(MOG-DFM: Multi-Objective-Guided Discrete Flow Matching)は、事前訓練された離散時間フローマッチングジェネレータを複数のスカラー目的に対してパレート効率の高いトレードオフに向けて操る一般的なフレームワークである。
各サンプリングステップにおいて、MOG-DFMは、候補遷移に対するハイブリッドなランク方向スコアを計算し、適応的なハイパーコーンフィルタを適用して、一貫した多目的進行を強制する。
また,MOG-DFMの塩基生成モデルとして,各種ペプチド生成のためのPepDFMと機能増強剤DNA生成のためのEnhancerDFMの2つの非条件離散フローマッチングモデルを訓練した。
我々はMOG-DFMが5つの性質(溶血性、非汚濁性、溶解性、半減期、結合親和性)に最適化されたペプチド結合体を生成し、特定のエンハンサークラスとDNA形状を持つDNA配列を設計する際に有効であることを示した。
総じてMOG-DFMは多目的誘導型生体分子配列設計のための強力なツールであることが証明されている。
関連論文リスト
- PepTune: De Novo Generation of Therapeutic Peptides with Multi-Objective-Guided Discrete Diffusion [2.6668932659159905]
治療ペプチドSMILESの同時生成と最適化のための多目的離散拡散モデルであるPepTuneを提案する。
我々は, 標的結合親和性, 膜透過性, 溶解性, 溶血性, 非汚濁性など, 複数の治療特性に最適化された多種多様な修飾ペプチドを生成する。
以上の結果から,PepTuneは離散状態空間における多目的シーケンス設計において,強力かつモジュール化されたアプローチであることを示す。
論文 参考訳(メタデータ) (2024-12-23T18:38:49Z) - Fine-Tuning Discrete Diffusion Models via Reward Optimization with Applications to DNA and Protein Design [56.957070405026194]
拡散モデルにより生成された軌道全体を通して報酬の直接バックプロパゲーションを可能にするアルゴリズムを提案する。
DRAKESは自然に似ており、高い報酬をもたらすシーケンスを生成することができる。
論文 参考訳(メタデータ) (2024-10-17T15:10:13Z) - Steering Masked Discrete Diffusion Models via Discrete Denoising Posterior Prediction [88.65168366064061]
本稿では,確率論的推論の課題として,事前学習したMDMを操る作業を行う新しいフレームワークであるDDPPを紹介する。
私たちのフレームワークは、3つの新しい目標のファミリーにつながります。
Wet-lab Validation(ウェット・ラブ・バリデーション)を用いて,報酬最適化タンパク質配列の過渡的発現を観察する。
論文 参考訳(メタデータ) (2024-10-10T17:18:30Z) - Multi-Modal and Multi-Attribute Generation of Single Cells with CFGen [76.02070962797794]
本研究では、単一セルデータ固有の離散性を保存するフローベースの条件生成モデルであるCellFlow for Generation (CFGen)を紹介する。
CFGenは、全ゲノムマルチモーダル単一セルデータを確実に生成し、重要な生物学的データ特性の回復を改善する。
論文 参考訳(メタデータ) (2024-07-16T14:05:03Z) - MoFormer: Multi-objective Antimicrobial Peptide Generation Based on Conditional Transformer Joint Multi-modal Fusion Descriptor [15.98003148948758]
AMPの多属性同時最適化のための多目的AMP合成パイプライン(MoFormer)を構築した。
MoFormerは、条件付き制約ときめ細かいマルチディスクリプタによってガイドされる、高度に構造化された潜在空間におけるAMPシーケンスの望ましい属性を改善している。
抗微生物活性の増強と溶血の最小化により,MoFormerは既存の方法よりも優れていた。
論文 参考訳(メタデータ) (2024-06-03T07:17:18Z) - Generative Flows on Discrete State-Spaces: Enabling Multimodal Flows with Applications to Protein Co-Design [37.634098563033795]
本稿では、フローベース生成モデルの実現に欠落したリンクを提供する離散データのフローベースモデルを提案する。
私たちの重要な洞察は、連続時間マルコフ連鎖を用いて連続空間フローマッチングの離散的等価性を実現できるということです。
この能力をタンパク質共設計のタスクに適用し、タンパク質の構造と配列を共同生成するモデルを学ぶ。
論文 参考訳(メタデータ) (2024-02-07T16:15:36Z) - BOtied: Multi-objective Bayesian optimization with tied multivariate ranks [33.414682601242006]
本稿では,非支配解と結合累積分布関数の極端量子化との自然な関係を示す。
このリンクにより、我々はPareto対応CDFインジケータと関連する取得関数BOtiedを提案する。
種々の合成および実世界の問題に対する実験により,BOtied は最先端MOBO 取得関数より優れていることが示された。
論文 参考訳(メタデータ) (2023-06-01T04:50:06Z) - Protein Design with Guided Discrete Diffusion [67.06148688398677]
タンパク質設計における一般的なアプローチは、生成モデルと条件付きサンプリングのための識別モデルを組み合わせることである。
離散拡散モデルのためのガイダンス手法であるdiffusioN Optimized Smpling (NOS)を提案する。
NOSは、構造に基づく手法の重要な制限を回避し、シーケンス空間で直接設計を行うことができる。
論文 参考訳(メタデータ) (2023-05-31T16:31:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。