論文の概要: Learning Flexible Forward Trajectories for Masked Molecular Diffusion
- arxiv url: http://arxiv.org/abs/2505.16790v1
- Date: Thu, 22 May 2025 15:30:17 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-23 17:12:48.400364
- Title: Learning Flexible Forward Trajectories for Masked Molecular Diffusion
- Title(参考訳): 分岐分子拡散のためのフレキシブルフォワード軌道の学習
- Authors: Hyunjin Seo, Taewon Kim, Sihyun Yu, SungSoo Ahn,
- Abstract要約: 仮面拡散モデル (MDMs) は離散データのモデリングにおいて顕著な進歩を遂げているが、分子生成におけるそのポテンシャルは未解明のままである。
標準MDMを適用すると、性能が著しく低下するという驚くべき結果が紹介される。
本研究では, 分子グラフ間の衝突を避けるため, 要素ごとの分解軌道を編成するMasked Element-wise Learnable Diffusion (MELD)を提案する。
- 参考スコア(独自算出の注目度): 14.219676204069655
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Masked diffusion models (MDMs) have achieved notable progress in modeling discrete data, while their potential in molecular generation remains underexplored. In this work, we explore their potential and introduce the surprising result that naively applying standards MDMs severely degrades the performance. We identify the critical cause of this issue as a state-clashing problem-where the forward diffusion of distinct molecules collapse into a common state, resulting in a mixture of reconstruction targets that cannot be learned using typical reverse diffusion process with unimodal predictions. To mitigate this, we propose Masked Element-wise Learnable Diffusion (MELD) that orchestrates per-element corruption trajectories to avoid collision between distinct molecular graphs. This is achieved through a parameterized noise scheduling network that assigns distinct corruption rates to individual graph elements, i.e., atoms and bonds. Extensive experiments on diverse molecular benchmarks reveal that MELD markedly enhances overall generation quality compared to element-agnostic noise scheduling, increasing the chemical validity of vanilla MDMs on ZINC250K from 15% to 93%, Furthermore, it achieves state-of-the-art property alignment in conditional generation tasks.
- Abstract(参考訳): 仮面拡散モデル (MDMs) は離散データのモデリングにおいて顕著な進歩を遂げているが、分子生成におけるそのポテンシャルは未解明のままである。
本研究は,その可能性を探究し,標準MDMが性能を著しく低下させるという驚くべき結果をもたらすものである。
我々は,この問題の重大な原因を,分子の前方拡散が共通状態に崩壊する状態クラッシング問題とみなす。
これを緩和するために, 分子グラフ間の衝突を避けるために, 要素ごとの分解軌道を編成するMasked Element-wise Learnable Diffusion (MELD)を提案する。
これは、個々のグラフ要素、すなわち原子と結合に異なる汚職率を割り当てるパラメータ化されたノイズスケジューリングネットワークによって達成される。
多様な分子ベンチマーク実験により、MELDは元素非依存ノイズスケジューリングと比較して全体的な生成品質を著しく向上させ、ZINC250K上のバニラMDMの化学的妥当性を15%から93%向上させ、さらに条件付き生成タスクにおける最先端のプロパティアライメントを実現することを明らかにした。
関連論文リスト
- Graph Diffusion that can Insert and Delete [14.488714063757278]
離散 Denoising Diffusion Probabilistic Models (DDPM) に基づくグラフの生成モデルは、分子生成に対する原則的なアプローチを提供する。
本稿では,ノードの単調な挿入と削除をサポートするため,ノイズ発生処理とノイズ発生処理を再構成する。
GrIDDDと呼ばれる結果のモデルは、生成中に化学グラフを動的に成長または縮小します。
論文 参考訳(メタデータ) (2025-06-06T19:45:45Z) - Remasking Discrete Diffusion Models with Inference-Time Scaling [12.593164604625384]
マスク付き拡散モデルに適用可能な手法であるリマスキー拡散モデル(ReMDM)を原則的に導入する。
最も興味深いことに、ReMDMは推論時間計算スケーリングの形で離散拡散を許容する。
論文 参考訳(メタデータ) (2025-03-01T02:37:51Z) - FragFM: Efficient Fragment-Based Molecular Generation via Discrete Flow Matching [0.3345437353879254]
分子グラフ生成のためのフラグメントベースの離散フローマッチングフレームワークであるFragFMを紹介する。
FragFMは断片レベルで分子を生成し、原子レベルの詳細を再構築するために粗大から細い自己エンコード機構を利用する。
論文 参考訳(メタデータ) (2025-02-19T07:01:00Z) - DiffMS: Diffusion Generation of Molecules Conditioned on Mass Spectra [60.39311767532607]
本稿では,DiffMSを提案する。DiffMS,式制限付きエンコーダ・デコーダ生成ネットワークは,このタスクにおける最先端性能を実現する。
遅延埋め込みと分子構造をブリッジするロバストデコーダを開発するために,フィンガー構造対による拡散デコーダの事前訓練を行う。
確立されたベンチマーク実験により、DiffMSはデノボ分子生成における既存のモデルよりも優れていることが示された。
論文 参考訳(メタデータ) (2025-02-13T18:29:48Z) - Conditional Synthesis of 3D Molecules with Time Correction Sampler [58.0834973489875]
Time-Aware Conditional Synthesis (TACS) は拡散モデルにおける条件生成の新しい手法である。
適応的に制御されたプラグアンドプレイの"オンライン"ガイダンスを拡散モデルに統合し、サンプルを所望の特性に向けて駆動する。
論文 参考訳(メタデータ) (2024-11-01T12:59:25Z) - Steering Masked Discrete Diffusion Models via Discrete Denoising Posterior Prediction [88.65168366064061]
本稿では,確率論的推論の課題として,事前学習したMDMを操る作業を行う新しいフレームワークであるDDPPを紹介する。
私たちのフレームワークは、3つの新しい目標のファミリーにつながります。
Wet-lab Validation(ウェット・ラブ・バリデーション)を用いて,報酬最適化タンパク質配列の過渡的発現を観察する。
論文 参考訳(メタデータ) (2024-10-10T17:18:30Z) - Mitigating Exposure Bias in Score-Based Generation of Molecular Conformations [6.442534896075223]
分子配座生成に用いるスコアベース生成モデルにおける露出バイアスを測定する手法を提案する。
我々は,DPMのみ用に設計された手法から適応した新しい補償アルゴリズム Input Perturbation (IP) を設計する。
GEOM-Drugsデータセットの最先端性能はGEOM-QM9と同等である。
論文 参考訳(メタデータ) (2024-09-21T04:54:37Z) - Masked Diffusion Models are Secretly Time-Agnostic Masked Models and Exploit Inaccurate Categorical Sampling [47.82616476928464]
仮面拡散モデル (MDM) は離散データの生成モデルとして人気がある。
我々はMDMのトレーニングとサンプリングの両方が理論的に時間変数から解放されていることを示す。
一般に使用されている32ビット浮動小数点精度においても,まず基礎となる数値問題を同定した。
論文 参考訳(メタデータ) (2024-09-04T17:48:19Z) - Data-Efficient Molecular Generation with Hierarchical Textual Inversion [48.816943690420224]
分子生成のための階層型テキスト変換法 (HI-Mol) を提案する。
HI-Molは分子分布を理解する上での階層的情報、例えば粗い特徴ときめ細かい特徴の重要性にインスパイアされている。
単一レベルトークン埋め込みを用いた画像領域の従来のテキストインバージョン法と比較して, マルチレベルトークン埋め込みにより, 基礎となる低ショット分子分布を効果的に学習することができる。
論文 参考訳(メタデータ) (2024-05-05T08:35:23Z) - Exploring Chemical Space with Score-based Out-of-distribution Generation [57.15855198512551]
生成微分方程式(SDE)にアウト・オブ・ディストリビューション制御を組み込んだスコアベース拡散方式を提案する。
いくつかの新しい分子は現実世界の薬物の基本的な要件を満たしていないため、MOODは特性予測器からの勾配を利用して条件付き生成を行う。
我々はMOODがトレーニング分布を超えて化学空間を探索できることを実験的に検証し、既存の方法で見いだされた分子、そして元のトレーニングプールの上位0.01%までも生成できることを実証した。
論文 参考訳(メタデータ) (2022-06-06T06:17:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。