論文の概要: Chem-GMNet: A Sphere-Native Geometric Transformer for Molecular Property Prediction
- arxiv url: http://arxiv.org/abs/2605.13262v1
- Date: Wed, 13 May 2026 09:43:55 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-14 23:30:27.95392
- Title: Chem-GMNet: A Sphere-Native Geometric Transformer for Molecular Property Prediction
- Title(参考訳): Chem-GMNet:分子特性予測のための球負幾何変換器
- Authors: Deepak Warrier, Raja Sekhar Pappala,
- Abstract要約: SMILESを汎用テキストとして扱い、数百万の教師付き事前学習で補償することにより、強力なMoleculeNet性能を示す。
Chem-GMNetは10のMoneculeNetエンドポイントのうち7つで$sim!35%少ないパラメータで勝利する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Modern SMILES-based chemical language models obtain strong MoleculeNet performance by treating SMILES as generic text and compensating with multi-million-molecule self-supervised pretraining. We ask: when a domain carries structural priors as rich as chemistry's, does it warrant a domain-native transformer rather than a generic one rescued by scale? We answer affirmatively with \textbf{GM-Net} (Geometric Measure Network), a transformer family in which every module is replaced by a sphere-native counterpart, and instantiate it as \textbf{Chem-GMNet}. Three blocks follow: SH-Embedding (tokens as learnable directions on $S^{k-1}$ lifted through a Gegenbauer feature map); DualSKA (a per-head fusion of a linear-time gated Sphere-Flow recurrence whose persistent state we prove is the truncated multipole expansion of the input distribution, and a softmax Sphere-Kernel branch over the same Schoenberg-valid kernel); and SH-FFN (sphere projection $\to$ Gegenbauer lift $\to$ moment readout). On canonical DeepChem scaffold splits, against same-shape ChemBERTa-2 baselines under the chemberta3-faithful protocol: (i) random-initialised, Chem-GMNet wins on 7 of 10 MoleculeNet endpoints at $\sim\!35\%$ fewer parameters; (ii) pretrained on the same 10M-SMILES ZINC corpus as ChemBERTa-2 MLM-10M, it matches or beats the public release on 6 of 8 shared endpoints (5/7 excluding a known ClinTox release anomaly). A $(k,L)$ ablation shows that increasing the sphere dimension from $k\!=\!8$ to $k\!=\!10$ at fixed $L\!=\!3$ lowers ESOL RMSE to $0.938$ at scratch, beating pretrained ChemBERTa-2 MLM-10M on this endpoint without any pretraining at all.
- Abstract(参考訳): 最新のSMILESベースの化学言語モデルは、SMILESを汎用テキストとして扱い、数百万分子の自己教師付き事前学習で補償することにより、強力な分子ネット性能を得る。
ドメインが化学に匹敵する構造的先行性を持つ場合、それはスケールによって救われた一般的なものではなく、ドメインネイティブなトランスフォーマーを保証しますか?
ここでは,各モジュールを球ネイティブに置き換えたトランスフォーマファミリーである \textbf{GM-Net} (Geometric Measure Network) で肯定的に回答し,それを \textbf{Chem-GMNet} としてインスタンス化する。
SH-Embedding ($S^{k-1}$ lifted on a Gegenbauer feature map)、DualSKA (Line-time gated Sphere-Flow repeatence の1頭当たりの融合であり、その持続状態が入力分布のマルチポール展開であることを証明している)、Softmax Sphere-Kernel branch on the same Schoenberg-valid kernel)、SH-FFN (sphere projection $\to$ Gegenbauer lift $\to$ moment readout) である。
Chemberta3-faithfulプロトコルで同一形状のChemBERTa-2ベースラインに対して、標準のDeepChemスキャフォールドが分裂する。
(i)ランダムに開始されたChem-GMNetは、$\sim\!
35\%$少ないパラメータ
(ii) ChemBERTa-2 MLM-10Mと同じ10M-SMILES ZINCコーパスで事前訓練され、8つの共有エンドポイントの6つ(ClinToxリリース異常の既知の例外を除く5/7)の公開リリースにマッチまたは打ち勝つ。
$(k,L)$ ablation は球次元を $k\!
=\!
8ドルから$k\!
=\!
10$ at fixed $L\!
=\!
3$はESOL RMSEをスクラッチで0.938ドルに下げ、前訓練されたChemBERTa-2 MLM-10Mを前訓練なしで打ち負かした。
関連論文リスト
- Wavelet Variance Equipartition as a Threshold for World-Model Quality and Quantum Kernel TN-Simulability [0.0]
我々はウェーブレットスケーリング指数$$を臨界診断として同定する。
振幅符号化された量子カーネルの古典的シミュラビリティのシャープな遷移境界として$=1/2$を確立する。
この分散は、厳密には$Var[X] = (d-2)$としてスケールする。
論文 参考訳(メタデータ) (2026-05-12T05:41:12Z) - Closing the Theory-Practice Gap in Spiking Transformers via Effective Dimension [13.891522069967507]
スパイキングトランスは、ニューロモルフィックハードウェアで38ドルから57ドル(約3,500円)のエネルギー効率を提供しながら、従来のトランスフォーマーと競合する精度を実現している。
本稿では, 自己注意をスパイクするための最初の包括的表現性理論を確立する。
論文 参考訳(メタデータ) (2026-04-17T07:15:53Z) - Global Convergence of Gradient EM for Over-Parameterized Gaussian Mixtures [53.51230405648361]
勾配EMの力学を考察し, テンソル分解を用いて幾何的景観を特徴付ける。
これは、m=2$という特別な場合を超えるEMや勾配EMに対する最初の大域収束と回復の結果である。
論文 参考訳(メタデータ) (2025-06-06T23:32:38Z) - Optimized Quantum Simulation Algorithms for Scalar Quantum Field Theories [0.3394351835510634]
量子コンピュータ上でのスカラー場理論の実用的なシミュレーション手法を提案する。
本手法はハミルトニアンの各種耐故障シミュレーションアルゴリズムを用いて実装する。
どちらの場合も、バウンダリが物理的に意味のあるシミュレーションを4つの物理量子ビット(106ドル)と1012ドル(T$-gate)の順番で行うことを示唆している。
論文 参考訳(メタデータ) (2024-07-18T18:00:01Z) - Emulating the interstellar medium chemistry with neural operators [0.0]
銀河の形成と進化は、星間物質(ISM)の進化と熱力学を管理する複雑な光化学過程の理解に依存している
本稿では,ニューラル演算子に基づく高速で訓練済みのエミュレータを用いた手続き型解決器の置換を目指す。
我々は、DeepONet形式を採用することにより、H$(9種、52反応)までの非平衡化学ネットワークをエミュレートする。
単一ゾーンモデルに対して$textttKROME$で得られる参照解と比較すると、得られた典型的な精度は10-2$である。
論文 参考訳(メタデータ) (2024-02-19T19:00:01Z) - Measurement-induced phase transition for free fermions above one dimension [46.176861415532095]
自由フェルミオンモデルに対する$d>1$次元における測定誘起エンタングルメント相転移の理論を開発した。
臨界点は、粒子数と絡み合いエントロピーの第2累積のスケーリング$$elld-1 ln ell$でギャップのない位相を分離する。
論文 参考訳(メタデータ) (2023-09-21T18:11:04Z) - Theory of free fermions under random projective measurements [43.04146484262759]
本研究では,一次元自由フェルミオンを局所的占有数のランダム射影的測定対象とする解析的手法を開発した。
問題の有効場理論として非線形シグマモデル(NLSM)を導出する。
論文 参考訳(メタデータ) (2023-04-06T15:19:33Z) - Density Matrix Renormalization Group with Tensor Processing Units [0.0]
GoogleのProcessing Units(TPU)は、機械学習ワークロードの高速化とスケールアップに特化した集積回路である。
本研究では、局所量子多体ハミルトニアンの基底状態を計算するための強力な数値的アプローチである密度行列再正規化群(DMRG)の高速化とスケールアップにTPUを用いることを実証する。
論文 参考訳(メタデータ) (2022-04-12T10:40:14Z) - Variance-Aware Confidence Set: Variance-Dependent Bound for Linear
Bandits and Horizon-Free Bound for Linear Mixture MDP [76.94328400919836]
線形バンドイットと線形混合決定プロセス(mdp)に対する分散認識信頼セットの構築方法を示す。
線形バンドイットに対しては、$d を特徴次元とする$widetildeo(mathrmpoly(d)sqrt1 + sum_i=1ksigma_i2) が成り立つ。
線形混合 MDP に対し、$widetildeO(mathrmpoly(d)sqrtK)$ regret bound を得る。
論文 参考訳(メタデータ) (2021-01-29T18:57:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。