論文の概要: Gumbel-Softmax Flow Matching with Straight-Through Guidance for Controllable Biological Sequence Generation
- arxiv url: http://arxiv.org/abs/2503.17361v1
- Date: Fri, 21 Mar 2025 17:59:43 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-24 14:55:19.707761
- Title: Gumbel-Softmax Flow Matching with Straight-Through Guidance for Controllable Biological Sequence Generation
- Title(参考訳): Gumbel-Softmax Flow Matching with Straight-Through Guidance for Controllable Biological Sequence Generation (特集 バイオサイバネティックス)
- Authors: Sophia Tang, Yinuo Zhang, Alexander Tong, Pranam Chatterjee,
- Abstract要約: 連続的単純体におけるフローマッチングはDNA配列設計の有望な戦略として現れてきたが、タンパク質生成に必要な高い単純体次元へのスケールに苦慮している。
本稿では,Gumbel-Softmax 補間剤を時間依存性温度で合成し,Gumbel-Softmax Flow と Score Matching を導入した。
我々のフレームワークは、高品質で多様な生成を可能にし、高次元の単純化に効率的にスケールすることができる。
- 参考スコア(独自算出の注目度): 45.105452288011726
- License:
- Abstract: Flow matching in the continuous simplex has emerged as a promising strategy for DNA sequence design, but struggles to scale to higher simplex dimensions required for peptide and protein generation. We introduce Gumbel-Softmax Flow and Score Matching, a generative framework on the simplex based on a novel Gumbel-Softmax interpolant with a time-dependent temperature. Using this interpolant, we introduce Gumbel-Softmax Flow Matching by deriving a parameterized velocity field that transports from smooth categorical distributions to distributions concentrated at a single vertex of the simplex. We alternatively present Gumbel-Softmax Score Matching which learns to regress the gradient of the probability density. Our framework enables high-quality, diverse generation and scales efficiently to higher-dimensional simplices. To enable training-free guidance, we propose Straight-Through Guided Flows (STGFlow), a classifier-based guidance method that leverages straight-through estimators to steer the unconditional velocity field toward optimal vertices of the simplex. STGFlow enables efficient inference-time guidance using classifiers pre-trained on clean sequences, and can be used with any discrete flow method. Together, these components form a robust framework for controllable de novo sequence generation. We demonstrate state-of-the-art performance in conditional DNA promoter design, sequence-only protein generation, and target-binding peptide design for rare disease treatment.
- Abstract(参考訳): 連続的単純体におけるフローマッチングはDNA配列設計の有望な戦略として現れてきたが、ペプチドやタンパク質の生成に必要な高い単純体次元へのスケールに苦慮している。
本稿では,Gumbel-Softmax 補間剤を時間依存性温度で合成し,Gumbel-Softmax Flow と Score Matching を導入した。
この補間法を用いて,スムーズなカテゴリー分布から単純な一頂点に集中した分布へ伝達するパラメータ化速度場を導出することにより,Gumbel-Softmax Flow Matchingを導入する。
あるいはGumbel-Softmax Score Matchingを提案し、確率密度の勾配を回帰することを学ぶ。
我々のフレームワークは、高品質で多様な生成を可能にし、高次元の単純化に効率的にスケールすることができる。
トレーニング不要な指導を可能にするために, ストレートスルー推定器を利用する分類器に基づく誘導法であるストレートスルーガイドフロー (STGFlow) を提案する。
STGFlowは、クリーンシーケンスで事前訓練された分類器を使用して効率的な推論時ガイダンスを可能にし、任意の離散フロー法で使用することができる。
これらのコンポーネントは共に、制御可能なde novoシーケンス生成のための堅牢なフレームワークを形成する。
そこで本研究では, 条件付きDNAプロモーターの設計, 配列限定タンパク質生成, 標的結合ペプチド設計における最先端性能について述べる。
関連論文リスト
- KL-geodesics flow matching with a novel sampling scheme [4.347494885647007]
非自己回帰型言語モデルは全てのトークンを同時に生成し、従来の自己回帰型モデルよりも潜在的に高速である。
テキスト生成のための条件付きフローマッチング手法について検討する。
論文 参考訳(メタデータ) (2024-11-25T17:15:41Z) - DeFoG: Discrete Flow Matching for Graph Generation [45.037260759871124]
DeFoGは、トレーニングからサンプリングをアンタングルするグラフ生成フレームワークである。
本稿では,性能を著しく向上し,必要な精錬工程数を削減できる新しいサンプリング手法を提案する。
論文 参考訳(メタデータ) (2024-10-05T18:52:54Z) - Consistency Flow Matching: Defining Straight Flows with Velocity Consistency [97.28511135503176]
本稿では,速度場の自己整合性を明示する新しいFM法であるConsistency Flow Matching(Consistency-FM)を紹介する。
予備実験により、一貫性FMは、一貫性モデルよりも4.4倍速く収束することにより、トレーニング効率を著しく向上することが示された。
論文 参考訳(メタデータ) (2024-07-02T16:15:37Z) - Dirichlet Flow Matching with Applications to DNA Sequence Design [37.12809686044779]
確率経路としてのディリクレ分布の混合に基づいて, 単純度に基づくディリクレフローマッチングを開発する。
蒸留したディリクレフローマッチングにより,最小性能で一段階のシーケンス生成が可能となる。
論文 参考訳(メタデータ) (2024-02-08T17:18:01Z) - Guided Flows for Generative Modeling and Decision Making [55.42634941614435]
その結果,ガイドフローは条件付き画像生成やゼロショット音声合成におけるサンプル品質を著しく向上させることがわかった。
特に、我々は、拡散モデルと比較して、オフライン強化学習設定axスピードアップにおいて、まず、計画生成にフローモデルを適用する。
論文 参考訳(メタデータ) (2023-11-22T15:07:59Z) - Free-form Flows: Make Any Architecture a Normalizing Flow [8.163244519983298]
本研究では,変数の変動の勾配を効率的に推定する訓練手法を開発した。
これにより、任意の次元保存ニューラルネットワークが、最大限のトレーニングを通じて生成モデルとして機能することが可能になる。
我々は$E(n)$-equivariantネットワークを用いた分子生成ベンチマークにおいて優れた結果を得た。
論文 参考訳(メタデータ) (2023-10-25T13:23:08Z) - Efficient Bound of Lipschitz Constant for Convolutional Layers by Gram
Iteration [122.51142131506639]
循環行列理論を用いて畳み込み層のスペクトルノルムに対して、精密で高速で微分可能な上界を導入する。
提案手法は, 精度, 計算コスト, スケーラビリティの観点から, 他の最先端手法よりも優れていることを示す。
これは畳み込みニューラルネットワークのリプシッツ正則化に非常に効果的であり、並行アプローチに対する競合的な結果である。
論文 参考訳(メタデータ) (2023-05-25T15:32:21Z) - Gaussianization Flows [113.79542218282282]
そこで本研究では,サンプル生成における効率のよい繰り返しと効率のよい逆変換を両立できる新しい型正規化フローモデルを提案する。
この保証された表現性のため、サンプル生成の効率を損なうことなく、マルチモーダルなターゲット分布をキャプチャできる。
論文 参考訳(メタデータ) (2020-03-04T08:15:06Z) - Semi-Supervised Learning with Normalizing Flows [54.376602201489995]
FlowGMMは、フローの正規化を伴う生成半教師付き学習におけるエンドツーエンドのアプローチである。
我々は AG-News や Yahoo Answers のテキストデータなど,幅広いアプリケーションに対して有望な結果を示す。
論文 参考訳(メタデータ) (2019-12-30T17:36:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。