論文の概要: Fast Organic Crystal Structure Prediction with Unit Cell Flow Matching
- arxiv url: http://arxiv.org/abs/2606.03199v1
- Date: Tue, 02 Jun 2026 05:58:40 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-03 22:00:04.793887
- Title: Fast Organic Crystal Structure Prediction with Unit Cell Flow Matching
- Title(参考訳): 単細胞フローマッチングによる高速有機結晶構造予測
- Authors: Alston Lo, Luka Mucko, Austin H. Cheng, Andy Cai, Alastair J. A. Price, Wojciech Matusik, Alán Aspuru-Guzik,
- Abstract要約: 有機結晶構造予測(CSP)は、有機固体の計算モデリングの要件である。
OXtalのような生成モデルは、安定な有機結晶構造を直接サンプリングすることで、このコストを劇的に削減する。
しかしながら、OXtalは、高価な三角形の層を持つバルク材料の大作物をモデル化することを好んで、明示的な格子パラメトリゼーションを行う。
冗長性のない単位セルを生成する大規模フローマッチングモデルであるClariを用いて,これを数秒に短縮する。
- 参考スコア(独自算出の注目度): 23.36679297800654
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Organic crystal structure prediction (CSP) is a requirement for computational modelling of organic solids, but traditionally costs several CPU-years per molecule. Generative models such as OXtal dramatically reduce this cost by sampling stable organic crystal structures directly. However, OXtal forgoes explicit lattice parametrization in favour of modelling large crops of the bulk material with expensive triangle layers, which can incur a computational cost of minutes per molecule. In this paper, we reduce this to seconds with Clari, a large-scale flow matching model that generates redundancy-free unit cells and replaces triangle layers with pure pair-bias attention. Clari requires only atom types and bonds as input and does not need an RDKit-sanitizable input molecule, which expands its applicability to challenging chemistries such as fullerenes, metal complexes, and atom clusters. We further ablate key design choices such as auxiliary losses, timestep distributions, noise priors, and self-conditioning. On OXtal's test sets, we surpass OXtal's solve rate while obtaining a speedup of $15$-$30\times$. Because Clari also models explicit hydrogens, it supports inference-time scaling via direct energy ranking, without any decoration or relaxation step. When generating 150 crystals and selecting the top-30 by energy, we further improve solve rate while maintaining a speedup of $5$-$8\times$. We also introduce the CSD Teaching Subset as a new test split of diverse and complex molecules for future benchmarking. Our contributions enable CSP within seconds, making large-scale virtual screening of organic solids practical. Code is available at https://github.com/aspuru-guzik-group/clari.
- Abstract(参考訳): 有機結晶構造予測(有機結晶構造予測、英: organic crystal structure prediction、CSP)は、有機固体の計算モデリングの要件であるが、伝統的に分子あたりのCPU年数もかかる。
OXtalのような生成モデルは、安定な有機結晶構造を直接サンプリングすることで、このコストを劇的に削減する。
しかし、OXtalは、高額な三角形の層を持つバルク材料の大作物をモデル化することで、1分子あたりの計算コストを数分に抑えるために、明確な格子パラメトリゼーションを行う。
本稿では, 冗長性のない単位セルを生成し, 三角形の層を純粋な対バイアスアテンションで置き換える大規模フローマッチングモデルであるClariを用いて, これを数秒に短縮する。
クラーリは入力として原子の種類と結合だけを必要とし、RDKitに安定な入力分子は必要とせず、フラーレン、金属錯体、原子クラスターのような挑戦的な化学反応に適用可能である。
さらに、補助的損失、タイムステップ分布、ノイズ先行、自己条件などの重要な設計選択を緩和する。
OXtalのテストセットでは、Oxtalの解速度を上回り、スピードアップは15ドル~30ドルです。
クラリはまた、明示的な水素をモデル化しているため、直接エネルギーランキングによる推論時間のスケーリングをサポートし、装飾や緩和のステップは一切ない。
150個の結晶を生成して上位30個をエネルギーで選択すると,5-$8\times$のスピードアップを維持しながら,解解率をさらに向上する。
我々はまた、将来のベンチマークのための多種多様な複雑な分子の新しいテスト分割として、CSDeaching Subsetを紹介した。
我々の貢献によりCSPは数秒で実現でき、有機固体の大規模仮想スクリーニングが実用化される。
コードはhttps://github.com/aspuru-guzik-group/clari.comから入手できる。
関連論文リスト
- OrgFlow: Generative Modeling of Organic Crystal Structures from Molecular Graphs [4.5375644408112565]
分子グラフから直接有機結晶構造を予測するためのフローマッチングモデルを提案する。
結合認識損失は、結合長さと接続性の分布を強制することによって、モデルが現実的な局所化学へ導かれる。
実験の結果,提案手法は既存のベースラインの10倍以上のマッチング率を達成することがわかった。
論文 参考訳(メタデータ) (2026-02-22T04:01:06Z) - OXtal: An All-Atom Diffusion Model for Organic Crystal Structure Prediction [63.318434943975255]
分子内コンフォーメーションと周期的パッキングの条件付き関節分布を学習する大規模100Mパラメータ全原子拡散モデルであるOXtalを導入する。
実験的に検証された600Kの結晶構造の大規模なデータセットを活用することで、OXtalは、以前のabinitio機械学習CSPメソッドよりも改善の順序を達成できる。
オキシタルは80%以上のパッキング類似率を獲得し、分子結晶化の熱力学的および運動論的規則性の両方をモデル化する能力を示している。
論文 参考訳(メタデータ) (2025-12-07T20:46:30Z) - Predictive Feature Caching for Training-free Acceleration of Molecular Geometry Generation [67.20779609022108]
フローマッチングモデルは、高忠実度分子ジオメトリを生成するが、推論中にかなりの計算コストを発生させる。
本研究は,分子幾何生成を加速する学習自由キャッシング戦略について論じる。
GEOM-Drugsデータセットの実験は、キャッシングがウォールクロックの推測時間の2倍の削減を実現することを示した。
論文 参考訳(メタデータ) (2025-10-06T09:49:14Z) - Challenges in Non-Polymeric Crystal Structure Prediction: Why a Geometric, Permutation-Invariant Loss is Needed [16.986704284824363]
分子集合問題に焦点をあて、同一の剛性分子のセット$mathcalS$を充填して結晶構造を形成する。
本稿では,鍵となる幾何学的特性を捉えた損失関数を導入する,より優れた定式化を提案する。
注目すべきは、このフレームワーク内では、単純な回帰モデルは、すでに以前のアプローチよりも優れています。
論文 参考訳(メタデータ) (2025-08-31T13:03:08Z) - FastCSP: Accelerated Molecular Crystal Structure Prediction with Universal Model for Atoms [21.170799561884035]
FastCSPは、機械学習の原子間ポテンシャルに基づくオープンソースのCrystal Structure Predictionワークフローである。
FastCSPは、既知の実験構造を一貫して生成し、それらを世界最小の分子あたり5kJ/molにランク付けする。
その結果,MLIPはシステム固有のチューニングを必要とせず,多様な化合物にまたがって利用できることがわかった。
論文 参考訳(メタデータ) (2025-08-04T17:25:55Z) - Siamese Foundation Models for Crystal Structure Prediction [70.63218101004398]
結晶構造予測(CSP)は、組成から安定な結晶構造を生成することを目的としている。
CSPは比較的未発見の領域である。
CSPに特化して設計されたシームズ基礎モデルを提案する。
論文 参考訳(メタデータ) (2025-03-13T15:44:16Z) - RGFN: Synthesizable Molecular Generation Using GFlowNets [51.33672611338754]
本稿では,化学反応の空間内で直接動作するGFlowNetフレームワークの拡張であるReaction-GFlowNetを提案する。
RGFNは、生成した候補の同等の品質を維持しながら、アウト・オブ・ボックスの合成を可能にする。
提案手法の有効性を,事前訓練されたプロキシモデルやGPUアクセラレーションドッキングなど,さまざまなオラクルモデルに適用した。
論文 参考訳(メタデータ) (2024-06-01T13:11:11Z) - Latent Conservative Objective Models for Data-Driven Crystal Structure
Prediction [62.36797874900395]
計算化学において、結晶構造予測は最適化問題である。
この問題に対処する1つのアプローチは、密度汎関数理論(DFT)に基づいてシミュレータを構築し、続いてシミュレーションで探索を実行することである。
我々は,LCOM(最近の保守的客観モデル)と呼ばれる我々の手法が,構造予測の成功率の観点から,最も優れたアプローチと同等に機能することを示す。
論文 参考訳(メタデータ) (2023-10-16T04:35:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。