論文の概要: BiMol-Diff: A Unified Diffusion Framework for Molecular Generation and Captioning
- arxiv url: http://arxiv.org/abs/2604.24089v1
- Date: Mon, 27 Apr 2026 06:29:55 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-28 17:12:07.771219
- Title: BiMol-Diff: A Unified Diffusion Framework for Molecular Generation and Captioning
- Title(参考訳): BiMol-Diff: 分子生成とカプセル化のための統一拡散フレームワーク
- Authors: Aditya Hemant Shahane, Anuj Kumar Sirohi, Devansh Arora, Nitin Kumar, Prathosh A P, Sandeep Kumar,
- Abstract要約: BiMol-Diffは、テキスト条件付き分子生成と分子キャプションのペアタスクのための統合拡散フレームワークである。
我々の鍵となるコンポーネントは、トークン回復の難しさに基づいて位置依存の破損を割り当てるトークン対応ノイズスケジュールである。
- 参考スコア(独自算出の注目度): 9.952326628787699
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Bridging molecular structures and natural language is essential for controllable design. Autoregressive models struggle with long-range dependencies, while standard diffusion processes apply uniform corruption across positions, which can distort structurally informative tokens. We present BiMol-Diff, a unified diffusion framework for the paired tasks of text-conditioned molecule generation and molecule captioning. Our key component is a token-aware noise schedule that assigns position-dependent corruption based on token recovery difficulty, preserving harder-to-recover substructures during the forward process. On ChEBI-20 and M3-20M, BiMol-Diff improves molecule reconstruction with a 15.4% relative gain in Exact Match and achieves strong captioning results, attaining best BLEU and BERTScore among compared baselines. These results indicate token-aware noising improves fidelity in molecular structure-language modelling.
- Abstract(参考訳): 分子構造のブリッジングと自然言語は制御可能な設計に不可欠である。
自己回帰モデルは長距離依存に苦しむ一方、標準的な拡散過程は、構造的に情報的トークンを歪ませることのできる位置にわたって均一な腐敗を施す。
テキスト条件付き分子生成と分子キャプションのペアタスクのための統合拡散フレームワークであるBiMol-Diffを提案する。
我々の鍵となるコンポーネントはトークン対応ノイズスケジュールであり、トークン回収の難しさに基づいて位置依存の破損を割り当て、前処理中にサブ構造を復元しにくくする。
ChEBI-20とM3-20Mでは、BiMol-DiffはExact Matchの15.4%の相対的なゲインで分子再構成を改善し、高いキャプション結果を得る。
これらの結果から,トークン認識ノーミングは分子構造言語モデリングにおける忠実度を向上させることが示唆された。
関連論文リスト
- FRIGID: Scaling Diffusion-Based Molecular Generation from Mass Spectra at Training and Inference Time [52.735012862324766]
本稿では,質量スペクトルに条件付き構造を生成する新しい拡散言語モデルを用いたフレームワークFRIGIDを提案する。
スペクトル非一貫性フラグメントを同定することにより、前方フラグメンテーションモデルが推論時間スケーリングを実現する方法を示す。
さらなる実証分析により、FRIGIDは推論時間の増大を伴う対数線形性能のスケーリングを示すことが示された。
論文 参考訳(メタデータ) (2026-04-17T19:11:18Z) - CAGenMol: Condition-Aware Diffusion Language Model for Goal-Directed Molecular Generation [14.125369423416275]
本稿では,分子配列上の状態認識型離散拡散フレームワークCAGenMolを提案する。
離散拡散と強化学習を結合することにより、モデルは生成軌道を微分不可能な目的と整列させる。
構造条件付き、プロパティ条件付き、デュアル条件付きベンチマークの実験は、一貫した改善を示している。
論文 参考訳(メタデータ) (2026-04-13T13:49:23Z) - MolDA: Molecular Understanding and Generation via Large Language Diffusion Model [7.901276712572294]
MolDAは、従来のARバックボーンを離散的なLarge Language Diffusion Modelに置き換える、新しいフレームワークである。
グローバルな構造的コヒーレンス、化学的妥当性、ロバストな推論を分子生成、キャプション、特性予測で保証する。
論文 参考訳(メタデータ) (2026-04-06T04:04:14Z) - Continuously Augmented Discrete Diffusion model for Categorical Generative Modeling [87.34677262370924]
標準離散拡散モデルは、吸収[MASK]トークンにそれらをマッピングすることで、すべての観測されていない状態を同一に扱う。
これは'インフォメーション・ヴォイド'を生成します。そこでは、偽のトークンから推測できるセマンティック情報は、デノイングステップの間に失われます。
連続的拡張離散拡散(Continuously Augmented Discrete Diffusion)は、連続的な潜在空間における対拡散で離散状態空間を拡大するフレームワークである。
論文 参考訳(メタデータ) (2025-10-01T18:00:56Z) - DiffMS: Diffusion Generation of Molecules Conditioned on Mass Spectra [60.39311767532607]
本稿では,DiffMSを提案する。DiffMS,式制限付きエンコーダ・デコーダ生成ネットワークは,このタスクにおける最先端性能を実現する。
遅延埋め込みと分子構造をブリッジするロバストデコーダを開発するために,フィンガー構造対による拡散デコーダの事前訓練を行う。
確立されたベンチマーク実験により、DiffMSはデノボ分子生成における既存のモデルよりも優れていることが示された。
論文 参考訳(メタデータ) (2025-02-13T18:29:48Z) - RFL: Simplifying Chemical Structure Recognition with Ring-Free Language [66.47173094346115]
化学構造を階層的に記述する新しいリング自由言語(RFL)を提案する。
RFLは複雑な分子構造を複数の部分に分解し、特異性と簡潔性の両方を保証する。
分子骨格と個々の環を段階的に予測する骨格生成モジュールからなる普遍的な分子骨格デコーダ(MSD)を提案する。
論文 参考訳(メタデータ) (2024-12-10T15:29:32Z) - AUTODIFF: Autoregressive Diffusion Modeling for Structure-based Drug Design [16.946648071157618]
構造に基づく薬物設計のための拡散型フラグメントワイド自己回帰生成モデル(SBDD)を提案する。
我々はまず,分子の局所構造の整合性を保持する共形モチーフという新しい分子組立戦略を設計する。
次に、タンパク質-リガンド複合体とSE(3)等価な畳み込みネットワークとの相互作用をエンコードし、拡散モデルを用いて分子モチーフ・バイ・モチーフを生成する。
論文 参考訳(メタデータ) (2024-04-02T14:44:02Z) - DecompDiff: Diffusion Models with Decomposed Priors for Structure-Based Drug Design [62.68420322996345]
既存の構造に基づく薬物設計法は、すべての配位子原子を等しく扱う。
腕と足場を分解した新しい拡散モデルDecompDiffを提案する。
提案手法は,高親和性分子の生成における最先端性能を実現する。
論文 参考訳(メタデータ) (2024-02-26T05:21:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。