論文の概要: MolSnap: Snap-Fast Molecular Generation with Latent Variational Mean Flow
- arxiv url: http://arxiv.org/abs/2508.05411v1
- Date: Thu, 07 Aug 2025 14:04:12 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-08 18:59:39.894311
- Title: MolSnap: Snap-Fast Molecular Generation with Latent Variational Mean Flow
- Title(参考訳): MolSnap: 潜時変量平均流を用いたスナップファスト分子生成
- Authors: Md Atik Ahamed, Qiang Ye, Qiang Cheng,
- Abstract要約: 分子グラフトークンとテキスト命令を共同で符号化するCausality-Aware Transformer(CAT)を導入する。
また,既存のフローベース手法を一般化する変分平均流(VMF)フレームワークを開発した。
我々のモデルは最先端のベースラインを上回り、より高い新規性(74.5%まで)、多様性(70.3%まで)、全データセットの100%の妥当性を達成する。
- 参考スコア(独自算出の注目度): 13.401822039640297
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Molecular generation conditioned on textual descriptions is a fundamental task in computational chemistry and drug discovery. Existing methods often struggle to simultaneously ensure high-quality, diverse generation and fast inference. In this work, we propose a novel causality-aware framework that addresses these challenges through two key innovations. First, we introduce a Causality-Aware Transformer (CAT) that jointly encodes molecular graph tokens and text instructions while enforcing causal dependencies during generation. Second, we develop a Variational Mean Flow (VMF) framework that generalizes existing flow-based methods by modeling the latent space as a mixture of Gaussians, enhancing expressiveness beyond unimodal priors. VMF enables efficient one-step inference while maintaining strong generation quality and diversity. Extensive experiments on four standard molecular benchmarks demonstrate that our model outperforms state-of-the-art baselines, achieving higher novelty (up to 74.5\%), diversity (up to 70.3\%), and 100\% validity across all datasets. Moreover, VMF requires only one number of function evaluation (NFE) during conditional generation and up to five NFEs for unconditional generation, offering substantial computational efficiency over diffusion-based methods.
- Abstract(参考訳): テキスト記述に条件付けされた分子生成は、計算化学と薬物発見の基本的な課題である。
既存の手法はしばしば、高品質で多様な生成と高速な推論を同時に確保するのに苦労する。
本研究では,2つの重要なイノベーションを通じて,これらの課題に対処する新しい因果認識フレームワークを提案する。
まずCAT(Causality-Aware Transformer)を導入し、分子グラフトークンとテキスト命令を共同で符号化し、生成時の因果依存性を強制する。
次に,変分平均流 (VMF) フレームワークを開発し,従属空間をガウスの混合としてモデル化し,一助前の表現性を高めることにより,既存のフローベース手法を一般化する。
VMFは、強力な生成品質と多様性を維持しながら、効率的なワンステップ推論を可能にする。
4つの標準分子ベンチマークによる大規模な実験により、我々のモデルは最先端のベースラインより優れており、より新規性(最大74.5\%)、多様性(最大70.3\%)、および全データセットで100\%の妥当性を実現している。
さらに、VMFは条件付き生成中に1つの関数評価(NFE)しか必要とせず、非条件生成には最大5つのNFEが必要である。
関連論文リスト
- GraspGen: A Diffusion-based Framework for 6-DOF Grasping with On-Generator Training [53.25060512131128]
我々は,オブジェクト中心のグリップ生成過程を反復拡散過程としてモデル化する上で,近年の成功を生かしている。
提案するフレームワークであるGraspGenは、グリップ生成を向上するDiffusion Transformerアーキテクチャで構成され、効率的な識別器と組み合わせて、サンプリングしたグリップのスコアとフィルタを行う。
GraspGenをオブジェクトとグリップの両方に拡張するために、53万以上のグリップからなるシミュレーションデータセットを新たにリリースしました。
論文 参考訳(メタデータ) (2025-07-17T13:09:28Z) - Multi-Source COVID-19 Detection via Variance Risk Extrapolation [19.844531606142496]
マルチソースの新型コロナウイルス検出チャレンジは、胸部CTスキャンを4つの病院や医療センターから収集されたデータから、新型コロナウイルスと非新型コロナウイルスのカテゴリーに分類することを目的としている。
このタスクにおける大きな課題は、イメージングプロトコル、スキャナー、および組織全体にわたる患者の人口の変化によって引き起こされるドメインシフトである。
我々は,モデルのクロスドメイン一般化を促進するために,VREx(Variance Risk Extrapolation)をトレーニングプロセスに組み込んだ。
本手法は, 検証セット上の4つの情報源の平均マクロF1スコアが0.96であり, 強い一般化が示されている。
論文 参考訳(メタデータ) (2025-06-29T12:34:57Z) - TFG-Flow: Training-free Guidance in Multimodal Generative Flow [73.93071065307782]
本稿では,マルチモーダルな生成フローのためのトレーニング不要指導法TFG-Flowを紹介する。
TFG-Flowは、離散変数の導出において、非バイアスサンプリングの特性を維持しながら、次元の呪いに対処する。
TFG-Flowは, 所望の特性を持つ分子を生成することにより, 薬物設計において大きな可能性を秘めている。
論文 参考訳(メタデータ) (2025-01-24T03:44:16Z) - Derivative-Free Guidance in Continuous and Discrete Diffusion Models with Soft Value-Based Decoding [84.3224556294803]
拡散モデルは、画像、分子、DNA、RNA、タンパク質配列の自然なデザイン空間を捉えるのに優れている。
これらの設計空間の自然性を保ちながら、下流の報酬関数を最適化することを目指している。
提案アルゴリズムは,中間雑音状態が将来高い報酬をもたらすことの先駆けとして,ソフトバリュー関数を統合する。
論文 参考訳(メタデータ) (2024-08-15T16:47:59Z) - FFHFlow: A Flow-based Variational Approach for Learning Diverse Dexterous Grasps with Shape-Aware Introspection [19.308304984645684]
マルチフィンガーハンドの多様なグリップを生成できる新しいモデルを提案する。
提案手法は, 高いベースラインに対する性能向上と実行時の効率向上を実現する。
また,現実世界の雑多な作業空間や密集した作業空間において,より多様性の高いオブジェクトを把握できることのメリットも示している。
論文 参考訳(メタデータ) (2024-07-21T13:33:08Z) - Data-Efficient Molecular Generation with Hierarchical Textual Inversion [48.816943690420224]
分子生成のための階層型テキスト変換法 (HI-Mol) を提案する。
HI-Molは分子分布を理解する上での階層的情報、例えば粗い特徴ときめ細かい特徴の重要性にインスパイアされている。
単一レベルトークン埋め込みを用いた画像領域の従来のテキストインバージョン法と比較して, マルチレベルトークン埋め込みにより, 基礎となる低ショット分子分布を効果的に学習することができる。
論文 参考訳(メタデータ) (2024-05-05T08:35:23Z) - IMUGPT 2.0: Language-Based Cross Modality Transfer for Sensor-Based
Human Activity Recognition [0.19791587637442667]
クロスモーダリティ転送アプローチは、既存のデータセットを、ビデオのようなソースモーダリティからターゲットモーダリティ(IMU)に変換する。
我々はIMUGPTに2つの新しい拡張を導入し、実用的なHARアプリケーションシナリオの利用を拡大した。
我々の多様性指標は、仮想IMUデータの生成に必要な労力を少なくとも50%削減できることを示した。
論文 参考訳(メタデータ) (2024-02-01T22:37:33Z) - Modular Flows: Differential Molecular Generation [18.41106104201439]
フローは、エンコーディングプロセスを反転させることで、分子を効果的に生成することができる。
既存のフローモデルでは、アーチファクトのデクタンス化や特定のノード/エッジの順序付けが必要となる。
我々はノードODEとグラフPDEのシステムに基づく連続正規化E(3)-同変フローを開発する。
我々のモデルは、メッセージパッシング時間ネットワークとしてキャストすることができ、その結果、密度推定と分子生成のタスクにおいて最上位のパフォーマンスが得られる。
論文 参考訳(メタデータ) (2022-10-12T09:08:35Z) - Multi-fidelity Hierarchical Neural Processes [79.0284780825048]
多要素代理モデリングは、異なるシミュレーション出力を融合させることで計算コストを削減する。
本稿では,多階層型階層型ニューラルネットワーク(MF-HNP)を提案する。
疫学および気候モデリングタスクにおけるMF-HNPの評価を行い、精度と不確実性評価の観点から競合性能を達成した。
論文 参考訳(メタデータ) (2022-06-10T04:54:13Z) - Molecular Attributes Transfer from Non-Parallel Data [57.010952598634944]
分子最適化をスタイル伝達問題として定式化し、非並列データの2つのグループ間の内部差を自動的に学習できる新しい生成モデルを提案する。
毒性修飾と合成性向上という2つの分子最適化タスクの実験により,本モデルがいくつかの最先端手法を著しく上回ることを示した。
論文 参考訳(メタデータ) (2021-11-30T06:10:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。