論文の概要: TABASCO: A Fast, Simplified Model for Molecular Generation with Improved Physical Quality
- arxiv url: http://arxiv.org/abs/2507.00899v1
- Date: Tue, 01 Jul 2025 16:01:58 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-03 14:22:59.72037
- Title: TABASCO: A Fast, Simplified Model for Molecular Generation with Improved Physical Quality
- Title(参考訳): TABASCO:物理品質を向上した高速で簡易な分子生成モデル
- Authors: Carlos Vonessen, Charles Harris, Miruna Cretu, Pietro Liò,
- Abstract要約: TABASCOは3次元分子生成のための変圧器モデルである。
分子中の原子を配列として扱い、生成後に決定的に結合を再構築する。
GEOM-Drugsベンチマークでは、TABASCOは最先端のPoseBustersの有効性を達成し、最強のベースラインの約10倍の速度で推論を行う。
- 参考スコア(独自算出の注目度): 15.030633864521562
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: State-of-the-art models for 3D molecular generation are based on significant inductive biases, SE(3), permutation equivariance to respect symmetry and graph message-passing networks to capture local chemistry, yet the generated molecules still struggle with physical plausibility. We introduce TABASCO which relaxes these assumptions: The model has a standard non-equivariant transformer architecture, treats atoms in a molecule as sequences and reconstructs bonds deterministically after generation. The absence of equivariant layers and message passing allows us to significantly simplify the model architecture and scale data throughput. On the GEOM-Drugs benchmark TABASCO achieves state-of-the-art PoseBusters validity and delivers inference roughly 10x faster than the strongest baseline, while exhibiting emergent rotational equivariance despite symmetry not being hard-coded. Our work offers a blueprint for training minimalist, high-throughput generative models suited to specialised tasks such as structure- and pharmacophore-based drug design. We provide a link to our implementation at github.com/carlosinator/tabasco.
- Abstract(参考訳): 3D分子生成の最先端モデルは、有意な誘導バイアス、SE(3)、対称性を尊重するための置換同値、局所化学を捉えるためのグラフメッセージ通過ネットワークに基づいているが、生成した分子は物理的妥当性に苦しむ。
モデルは標準の非同変変変圧器アーキテクチャを持ち、分子内の原子を配列として扱い、生成後に決定的に結合を再構築する。
均質なレイヤとメッセージパッシングがないため、モデルアーキテクチャを大幅に単純化し、データのスループットを拡大できます。
GEOM-Drugsベンチマークでは、TABASCOは最先端のPoseBustersの有効性を達成し、最強のベースラインの約10倍の速度で推論を行い、対称性がハードコードされていないにもかかわらず、創発的な回転同値を示す。
我々の研究は、ミニマリストで高スループットな生成モデルをトレーニングするための青写真を提供する。
我々はgithub.com/carlosinator/tabascoで実装へのリンクを提供しています。
関連論文リスト
- Sampling 3D Molecular Conformers with Diffusion Transformers [13.536503487456622]
拡散変換器 (DiT) は生成モデルにおいて高い性能を示した。
分子へのDiTの適用は、離散的な分子グラフ情報と連続した3次元幾何学の統合など、新しい課題をもたらす。
モジュールアーキテクチャを通じてこれらの課題に対処するために,DiTを適応させるフレームワークであるDiTMCを提案する。
論文 参考訳(メタデータ) (2025-06-18T11:47:59Z) - Towards Unified and Lossless Latent Space for 3D Molecular Latent Diffusion Modeling [77.26556208024633]
3次元分子生成は、薬物発見と物質科学に不可欠である。
既存のアプローチは、典型的には不変かつ同変なモジュラリティに対して別々のラテント空間を保持する。
我々は,3次元分子を潜在空間から潜在配列に圧縮するマルチモーダルVAEである textbfUAE-3D を提案する。
論文 参考訳(メタデータ) (2025-03-19T08:56:13Z) - Conditional Synthesis of 3D Molecules with Time Correction Sampler [58.0834973489875]
Time-Aware Conditional Synthesis (TACS) は拡散モデルにおける条件生成の新しい手法である。
適応的に制御されたプラグアンドプレイの"オンライン"ガイダンスを拡散モデルに統合し、サンプルを所望の特性に向けて駆動する。
論文 参考訳(メタデータ) (2024-11-01T12:59:25Z) - SemlaFlow -- Efficient 3D Molecular Generation with Latent Attention and Equivariant Flow Matching [43.56824843205882]
SemlaはスケーラブルなE(3)等価メッセージパッシングアーキテクチャである。
SemlaFlowは、原子タイプ、座標、結合タイプ、正式な電荷の結合分布を生成するために訓練されている。
本モデルでは,20段階のサンプリングを行ない,ベンチマークデータセットの最先端結果を生成する。
論文 参考訳(メタデータ) (2024-06-11T13:51:51Z) - DecompDiff: Diffusion Models with Decomposed Priors for Structure-Based Drug Design [62.68420322996345]
既存の構造に基づく薬物設計法は、すべての配位子原子を等しく扱う。
腕と足場を分解した新しい拡散モデルDecompDiffを提案する。
提案手法は,高親和性分子の生成における最先端性能を実現する。
論文 参考訳(メタデータ) (2024-02-26T05:21:21Z) - Navigating the Design Space of Equivariant Diffusion-Based Generative
Models for De Novo 3D Molecule Generation [1.3124513975412255]
深部生成拡散モデル(Deep Generative diffusion model)は、材料科学と薬物発見における3D de novo分子設計のための有望な道である。
E(3)-同変拡散モデルの設計空間を探索し、未探索領域に焦点をあてる。
本稿では,QM9データセットとGEOM-Drugsデータセットの確立したモデルよりも一貫して優れるEQGAT-diffモデルを提案する。
論文 参考訳(メタデータ) (2023-09-29T14:53:05Z) - CoarsenConf: Equivariant Coarsening with Aggregated Attention for
Molecular Conformer Generation [3.31521245002301]
本稿では, 反角に基づく分子グラフをSE(3)等価な階層的変分オートエンコーダに統合するCoarsenConfを紹介する。
等変粗粒化により、回転可能な結合を介して連結された部分グラフの微細な原子座標を集約し、可変長粗粒化潜在表現を生成する。
本モデルでは, 粗粒の潜在表現から細粒度座標を復元する新しいアグリゲートアテンション機構を用いて, 正確なコンフォメータを効率よく生成する。
論文 参考訳(メタデータ) (2023-06-26T17:02:54Z) - Geometric Latent Diffusion Models for 3D Molecule Generation [172.15028281732737]
生成モデル、特に拡散モデル(DM)は、特徴豊富な測地を生成する上で有望な結果を得た。
我々はGeoLDM(Geometric Latent Diffusion Models)と呼ばれる新しい3次元分子生成法を提案する。
論文 参考訳(メタデータ) (2023-05-02T01:07:22Z) - Structure-based Drug Design with Equivariant Diffusion Models [40.73626627266543]
本稿では,タンパク質ポケットに新しい条件を付加したSE(3)-同変拡散モデルDiffSBDDを提案する。
我々のサイリコ実験では、DiffSBDDが地上の真実データの統計を効果的に捉えていることが示されています。
これらの結果は、拡散モデルが従来の方法よりも正確に構造データの複雑な分布を表すという仮定を支持する。
論文 参考訳(メタデータ) (2022-10-24T15:51:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。