論文の概要: Solvaformer: an SE(3)-equivariant graph transformer for small molecule solubility prediction
- arxiv url: http://arxiv.org/abs/2511.09774v1
- Date: Fri, 14 Nov 2025 01:08:58 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-14 22:53:22.478095
- Title: Solvaformer: an SE(3)-equivariant graph transformer for small molecule solubility prediction
- Title(参考訳): ソルバフォーマ:SE(3)-等変量グラフ変換器による微小分子溶解度予測
- Authors: Jonathan Broadbent, Michael Bailey, Mingxuan Li, Abhishek Paul, Louis De Lescure, Paul Chauvin, Lorenzo Kogler-Anele, Yasser Jangjou, Sven Jager,
- Abstract要約: Solvaformer は、独立なSE(3)対称性を持つ複数の分子として解をモデル化する幾何学的なグラフ変換器である。
我々はSolvaformerに、量子力学データと実験的測定に基づいて訓練する交互バッチレギュレータを用いて、溶解度(log S)と溶解自由エネルギーの両方を予測するように訓練する。
Solvaformerは学習したモデルの中で最強の総合性能を達成し、DFT支援勾配ブースティングベースラインにアプローチする。
- 参考スコア(独自算出の注目度): 2.274456001127632
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Accurate prediction of small molecule solubility using material-sparing approaches is critical for accelerating synthesis and process optimization, yet experimental measurement is costly and many learning approaches either depend on quantumderived descriptors or offer limited interpretability. We introduce Solvaformer, a geometry-aware graph transformer that models solutions as multiple molecules with independent SE(3) symmetries. The architecture combines intramolecular SE(3)-equivariant attention with intermolecular scalar attention, enabling cross-molecular communication without imposing spurious relative geometry. We train Solvaformer in a multi-task setting to predict both solubility (log S) and solvation free energy, using an alternating-batch regimen that trains on quantum-mechanical data (CombiSolv-QM) and on experimental measurements (BigSolDB 2.0). Solvaformer attains the strongest overall performance among the learned models and approaches a DFT-assisted gradient-boosting baseline, while outperforming an EquiformerV2 ablation and sequence-based alternatives. In addition, token-level attention produces chemically coherent attributions: case studies recover known intra- vs. inter-molecular hydrogen-bonding patterns that govern solubility differences in positional isomers. Taken together, Solvaformer provides an accurate, scalable, and interpretable approach to solution-phase property prediction by uniting geometric inductive bias with a mixed dataset training strategy on complementary computational and experimental data.
- Abstract(参考訳): 物質分離手法による小さな分子溶解度の正確な予測は、合成とプロセス最適化を加速するために重要であるが、実験的な測定はコストがかかり、多くの学習手法は量子由来の記述子に依存するか、限定的な解釈性を提供する。
独立なSE(3)対称性を持つ複数の分子として解をモデル化する幾何対応グラフ変換器であるSolvaformerを紹介する。
このアーキテクチャは分子内SE(3)同変の注意と分子間スカラーの注意を組み合わせることで、刺激的な相対幾何学を含まない分子間通信を可能にする。
我々はSolvaformerをマルチタスクで訓練し、量子力学データ(CombiSolv-QM)と実験値(BigSolDB 2.0)に基づいて、溶解度(log S)と解離自由エネルギーの両方を予測する。
Solvaformerは学習したモデルの中で最強の総合性能を獲得し、DFT支援の勾配ブースティングベースラインに近づき、EquiformerV2アブレーションやシーケンスベースの代替よりも優れている。
さらに、トークンレベルの注意は化学的にコヒーレントな属性を生じさせ、例えば、位置異性体の溶解度の違いを管理する既知の分子内対分子間水素結合パターンを復元するケーススタディである。
Solvaformerは、幾何学的帰納バイアスと相補的な計算および実験データに関する混合データセットトレーニング戦略を結合することにより、解相特性予測に対する正確でスケーラブルで解釈可能なアプローチを提供する。
関連論文リスト
- Learning Inter-Atomic Potentials without Explicit Equivariance [24.438029202222555]
TransIP: Transformer-based Inter-Atomic Potentialsは、原子間ポテンシャルの新たなトレーニングパラダイムである。
提案手法は, 組込み空間における表現を最適化することにより, SO(3)-同変を学習するための汎用的非同変トランスフォーマーモデルである。
データ拡張ベースラインと比較して、TransIPはさまざまなOMol25データセットサイズで40%から60%のパフォーマンス向上を実現している。
論文 参考訳(メタデータ) (2025-09-25T22:15:10Z) - Towards Unified and Lossless Latent Space for 3D Molecular Latent Diffusion Modeling [90.23688195918432]
3次元分子生成は、薬物発見と物質科学に不可欠である。
既存のアプローチは、典型的には不変かつ同変なモジュラリティに対して別々のラテント空間を保持する。
我々は,3次元分子を潜在空間から潜在配列に圧縮するマルチモーダルVAEである textbfUAE-3D を提案する。
論文 参考訳(メタデータ) (2025-03-19T08:56:13Z) - Interpolation and differentiation of alchemical degrees of freedom in machine learning interatomic potentials [0.980222898148295]
原子性物質シミュレーションにおける連続的および微分可能なアルケミカル自由度の利用について報告する。
提案手法は,MLIPのメッセージパッシングおよび読み出し機構の変更とともに,対応する重みを持つアルケミカル原子を入力グラフに導入する。
MLIPのエンドツーエンドの微分可能性により、構成重みに対するエネルギー勾配の効率的な計算が可能となる。
論文 参考訳(メタデータ) (2024-04-16T17:24:22Z) - From Peptides to Nanostructures: A Euclidean Transformer for Fast and
Stable Machine Learned Force Fields [5.013279299982324]
本稿では,疎等式表現と自己注意機構を組み合わせたSO3kratesというトランスフォーマーアーキテクチャを提案する。
SO3kratesは精度、安定性、速度の独特な組み合わせを実現し、拡張時間とシステムサイズスケールでの物質の量子特性の洞察に富んだ分析を可能にする。
論文 参考訳(メタデータ) (2023-09-21T09:22:05Z) - Equivariant Diffusion for Molecule Generation in 3D [74.289191525633]
この研究は、ユークリッド変換に同値な3次元の分子計算生成のための拡散モデルを導入する。
提案手法は, 従来の3次元分子生成法に比べて, 生成した試料の品質と訓練時の効率を著しく向上させる。
論文 参考訳(メタデータ) (2022-03-31T12:52:25Z) - A deep learning driven pseudospectral PCE based FFT homogenization
algorithm for complex microstructures [68.8204255655161]
提案手法は,従来の手法よりも高速に評価できる一方で,興味の中心モーメントを予測できることを示す。
提案手法は,従来の手法よりも高速に評価できると同時に,興味の中心モーメントを予測できることを示す。
論文 参考訳(メタデータ) (2021-10-26T07:02:14Z) - Learning Neural Generative Dynamics for Molecular Conformation
Generation [89.03173504444415]
分子グラフから分子コンフォメーション(つまり3d構造)を生成する方法を検討した。
分子グラフから有効かつ多様なコンフォーメーションを生成する新しい確率論的枠組みを提案する。
論文 参考訳(メタデータ) (2021-02-20T03:17:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。