論文の概要: Active Flow Expansion for Out-of-Distribution Discovery: from Theory to Molecules
- arxiv url: http://arxiv.org/abs/2606.08802v1
- Date: Sun, 07 Jun 2026 19:43:22 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-09 14:42:06.458204
- Title: Active Flow Expansion for Out-of-Distribution Discovery: from Theory to Molecules
- Title(参考訳): アウト・オブ・ディストリビューション発見のためのアクティブフロー展開:理論から分子へ
- Authors: Riccardo De Santi, Bruce Lee, Cristian Perez Jensen, Kimon Protopapas, Sophia Tang, Cheng-Hao Liu, Pranam Chatterjee, Yisong Yue, Andreas Krause,
- Abstract要約: 本稿では,モデルの生成可能な集合を拡大し,有効設計空間のカバレッジを増大させる,分散フローモデリングのための新しい学習原理を提案する。
本稿では, 検証器フィードバックを用いて, 新しい有効領域に事前学習モデルを拡張する, 継続的な事前学習手法であるアクティブフロー拡張(ActFlow)を提案する。
その結果、ActFlowは、初期訓練済みモデルによってモデル化された領域を超えて、有効な範囲を広げ、広く採用されている合成フロー事前学習法よりもはるかに優れていることがわかった。
- 参考スコア(独自算出の注目度): 62.81692030818376
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Standard flow and diffusion pre-training matches the distribution of available data (e.g., molecules), which often covers only a small fraction of the valid design space. In generative discovery, however, one aims to sample valid new-to-nature designs, assigned negligible probability under, and thus inaccessible to, standard models fitted to the observed data. To overcome this limitation, we depart from data distribution matching and view a generative model through its generable set: the region it covers with non-negligible probability. This allows to introduce a new learning principle for out-of-distribution flow modeling: enlarging a model's generable set to increase coverage of the valid design space. We propose Active Flow Expansion (ActFlow), a continued pre-training method that employs verifier feedback to expand a pre-trained model over new valid regions by iteratively adapting to synthetic data generated through active exploration in the learned flow representation. Theoretically, we establish to our knowledge first-of-their-kind statistical learning guarantees for out-of-distribution flow modeling, analyzing generable set expansion as a local-to-global reachability process over a learned representation. Empirically, we assess ActFlow with suitable out-of-distribution generative modeling metrics across small organic molecules, mid-sized drug-like molecules, therapeutic peptides, and protein sequence design tasks. Results show that ActFlow expands valid coverage far beyond the region modeled by the initial pre-trained model, significantly outperforming widely adopted synthetic flow pre-training methods.
- Abstract(参考訳): 標準流れと拡散事前学習は利用可能なデータ(例えば分子)の分布と一致する。
しかし、生成的発見においては、有効な新生設計をサンプル化し、観測されたデータに適合する標準モデルの下で無視可能な確率を割り当てることを目的としている。
この制限を克服するため、我々はデータ分散マッチングから離脱し、生成可能な集合を通して生成モデルを見る。
これにより、アウト・オブ・ディストリビューション・フロー・モデリングのための新しい学習原則を導入することができる。
本研究では,学習フロー表現における能動探索によって生成された合成データに反復的に適応することにより,検証者フィードバックを用いて,新たな有効領域に事前学習モデルを拡張するための,継続的な事前学習手法であるアクティブフロー拡張(ActFlow)を提案する。
理論的には,学習表現上の局所的-言語的リーチビリティプロセスとして生成可能な集合拡大を解析し,分布外フローモデリングにおける第一種統計学習の保証を確立する。
実験により,ActFlowを,小さな有機分子,中規模の薬物様分子,治療ペプチド,タンパク質配列設計タスクに適するアウト・オブ・ディストリビューション・ジェネレーション・モデリング・メトリクスで評価した。
その結果、ActFlowは、初期訓練済みモデルによってモデル化された領域を超えて、有効な範囲を広げ、広く採用されている合成フロー事前学習法よりもはるかに優れていることがわかった。
関連論文リスト
- Verifier-Constrained Flow Expansion for Discovery Beyond the Data [39.65241651963903]
フローと拡散モデルは通常、限られた利用可能なデータに基づいて事前訓練され、有効な設計空間のごく一部だけをカバーする。
これは科学的な発見アプリケーションの基本的制限であり、典型的には、利用可能なデータ分布を超えて有効な設計をサンプリングすることを目的としている。
本稿では,フロープロセスのノイズ状態空間上での検証式制約付きエントロピーにより,両問題に確実に対処するスケーラブルなミラー降下方式であるFlow Expander(FE)を提案する。
論文 参考訳(メタデータ) (2026-02-17T20:20:38Z) - TFG-Flow: Training-free Guidance in Multimodal Generative Flow [73.93071065307782]
本稿では,マルチモーダルな生成フローのためのトレーニング不要指導法TFG-Flowを紹介する。
TFG-Flowは、離散変数の導出において、非バイアスサンプリングの特性を維持しながら、次元の呪いに対処する。
TFG-Flowは, 所望の特性を持つ分子を生成することにより, 薬物設計において大きな可能性を秘めている。
論文 参考訳(メタデータ) (2025-01-24T03:44:16Z) - Understanding Reinforcement Learning-Based Fine-Tuning of Diffusion Models: A Tutorial and Review [63.31328039424469]
このチュートリアルは、下流の報酬関数を最適化するための微調整拡散モデルのための方法を網羅的に調査する。
PPO,微分可能最適化,報酬重み付きMLE,値重み付きサンプリング,経路整合性学習など,様々なRLアルゴリズムの適用について説明する。
論文 参考訳(メタデータ) (2024-07-18T17:35:32Z) - Mixed Continuous and Categorical Flow Matching for 3D De Novo Molecule Generation [0.0]
フローマッチングは拡散モデルを一般化する最近提案された生成モデリングフレームワークである。
本稿では,フローマッチングフレームワークを,確率単純性として知られるカテゴリデータの連続的な表現に制約のあるフローを構築することにより,カテゴリデータに拡張する。
実際には、データのカテゴリ的な性質に配慮しないシンプルなアプローチは、同等あるいは優れたパフォーマンスをもたらすことが分かっています。
論文 参考訳(メタデータ) (2024-04-30T17:37:21Z) - Uncertainty quantification and out-of-distribution detection using
surjective normalizing flows [46.51077762143714]
本稿では,深層ニューラルネットワークモデルにおける分布外データセットの探索的正規化フローを用いた簡単なアプローチを提案する。
本手法は, 流通外データと流通内データとを確実に識別できることを示す。
論文 参考訳(メタデータ) (2023-11-01T09:08:35Z) - Generative Flows with Invertible Attentions [135.23766216657745]
生成フローモデルに対する2種類の非可逆的注意機構を導入する。
フロー特徴写像の2分割毎に注意重みと入力表現を学習するために,分割に基づく注意機構を利用する。
提案手法は, トラクタブルジャコビアン行列を用いた非可逆アテンションモジュールをフローベースモデルの任意の位置にシームレスに統合する。
論文 参考訳(メタデータ) (2021-06-07T20:43:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。