論文の概要: SIGMA: Structure-Invariant Generative Molecular Alignment for Chemical Language Models via Autoregressive Contrastive Learning
- arxiv url: http://arxiv.org/abs/2603.25062v1
- Date: Thu, 26 Mar 2026 05:55:17 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-27 20:52:48.129987
- Title: SIGMA: Structure-Invariant Generative Molecular Alignment for Chemical Language Models via Autoregressive Contrastive Learning
- Title(参考訳): SIGMA:自己回帰的コントラスト学習による化学言語モデルのための構造不変な分子配向
- Authors: Xinyu Wang, Fei Dou, Jinbo Bi, Minghu Song,
- Abstract要約: 構造不変な生成分子アライメント(SIGMA)を提案する。
線形表現を変更するのではなく、SIGMAはモデルが幾何対称性を厳密に認識することを可能にする。
標準ベンチマークにおける実証的な評価は、SIGMAがシーケンスのスケーラビリティとグラフの忠実さのギャップを埋めることを示している。
- 参考スコア(独自算出の注目度): 8.06177122578894
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Linearized string representations serve as the foundation of scalable autoregressive molecular generation; however, they introduce a fundamental modality mismatch where a single molecular graph maps to multiple distinct sequences. This ambiguity leads to \textit{trajectory divergence}, where the latent representations of structurally equivalent partial graphs drift apart due to differences in linearization history. To resolve this without abandoning the efficient string formulation, we propose Structure-Invariant Generative Molecular Alignment (SIGMA). Rather than altering the linear representation, SIGMA enables the model to strictly recognize geometric symmetries via a token-level contrastive objective, which explicitly aligns the latent states of prefixes that share identical suffixes. Furthermore, we introduce Isomorphic Beam Search (IsoBeam) to eliminate isomorphic redundancy during inference by dynamically pruning equivalent paths. Empirical evaluations on standard benchmarks demonstrate that SIGMA bridges the gap between sequence scalability and graph fidelity, yielding superior sample efficiency and structural diversity in multi-parameter optimization compared to strong baselines.
- Abstract(参考訳): 線形化された文字列表現は、スケーラブルな自己回帰的分子生成の基礎となるが、単一の分子グラフが複数の異なる配列にマッピングする基本的なモダリティミスマッチを導入する。
この曖昧さは、構造的に等価な部分グラフの潜在表現が、線形化の歴史の違いによって分離されるような、textit{trajectory divergence} につながる。
効率的な文字列の定式化を放棄せずにこの問題を解決するために,構造不変生成分子配位 (Structure-Invariant Generative Molecular Alignment, SIGMA) を提案する。
線形表現を変更するのではなく、SIGMAは、同じ接尾辞を共有する接頭辞の潜在状態を明示的に整列するトークンレベルのコントラスト目的により、幾何学的対称性を厳密に認識することを可能にする。
さらに,アイソモーフィックビームサーチ(アイソモーフィックビームサーチ)を導入し,等価経路を動的に刈り取ることにより,推論中の等方的冗長性を解消する。
標準ベンチマークにおける実証的な評価は、SIGMAがシーケンスのスケーラビリティとグラフの忠実度の間のギャップを橋渡しし、強いベースラインと比較して、多パラメータ最適化において、より優れたサンプル効率と構造的多様性をもたらすことを示している。
関連論文リスト
- Rethinking Diffusion Models with Symmetries through Canonicalization with Applications to Molecular Graph Generation [56.361076943802594]
CanonFlowは、挑戦的なGEOM-DRUGデータセット上で最先端のパフォーマンスを実現している。
論文 参考訳(メタデータ) (2026-02-16T18:58:55Z) - A Study of Adaptive Modeling Towards Robust Generalization [14.00955228748485]
我々は,構造トークンを適応的にスケーリングしながら,幾何学的情報に基づく言語推論を基盤とする,統一された全原子フレームワークを提案する。
様々な全原子のベンチマークにおいて、提案手法は不均一な構造的推論において一貫した利得をもたらす。
論文 参考訳(メタデータ) (2026-02-02T20:35:44Z) - Modality Alignment across Trees on Heterogeneous Hyperbolic Manifolds [49.95082206008502]
ツリーを横断するアライメントは、画像とテキストのモダリティの両方に対してツリーのような階層的な特徴を構築し、調整する手法である。
本稿では,中間トランスフォーマー層からの視覚的クラストークンにクロスアテンション機構を適用した意味認識型視覚特徴抽出フレームワークを提案する。
論文 参考訳(メタデータ) (2025-10-31T11:32:15Z) - Histopathology Whole Slide Image Analysis with Heterogeneous Graph
Representation Learning [78.49090351193269]
本稿では,WSI分析のために,異なる種類の核間の相互関係を利用する新しいグラフベースのフレームワークを提案する。
具体的には、WSI を各ノードに "nucleus-type" 属性と各エッジに類似した意味属性を持つ異種グラフとして定式化する。
我々のフレームワークは、様々なタスクに対してかなりのマージンで最先端の手法より優れています。
論文 参考訳(メタデータ) (2023-07-09T14:43:40Z) - Staged trees and asymmetry-labeled DAGs [2.66269503676104]
本稿では,実生木を最小のベイズネットワークで表現し,直感的に条件付き独立性を読み取る方法を提案する。
また,非対称性ラベル付き有向非巡回グラフ (asymmetric-labeled direct acyclic graph) と呼ばれる新しいラベル付きグラフも定義する。
論文 参考訳(メタデータ) (2021-08-04T12:20:47Z) - Joint Network Topology Inference via Structured Fusion Regularization [70.30364652829164]
結合ネットワークトポロジ推論は、異種グラフ信号から複数のグラフラプラシア行列を学習する標準的な問題を表す。
新規な構造化融合正規化に基づく一般グラフ推定器を提案する。
提案するグラフ推定器は高い計算効率と厳密な理論保証の両方を享受できることを示す。
論文 参考訳(メタデータ) (2021-03-05T04:42:32Z) - Articulated Shape Matching Using Laplacian Eigenfunctions and
Unsupervised Point Registration [38.16866987817019]
スペクトルグラフ理論は、これらのグラフを低次元空間にマッピングし、それらの埋め込みを整列させることで形状と一致させることができる。
我々は、ラプラシア行列の固有関数の最適部分集合を選択することによって、2つの同値な$K$-次元の点集合の最良の整合を求める新しい定式化を導出する。
論文 参考訳(メタデータ) (2020-12-14T08:49:25Z) - A Differentiable Relaxation of Graph Segmentation and Alignment for AMR
Parsing [75.36126971685034]
我々は、アライメントとセグメンテーションをモデルの潜在変数として扱い、エンドツーエンドのトレーニングの一部としてそれらを誘導する。
また,AMRの個々の構造を扱うために手作りされたLyu2018AMRPAのセグメンテーションルールに依存するモデルにもアプローチした。
論文 参考訳(メタデータ) (2020-10-23T21:22:50Z) - Isometric Transformation Invariant and Equivariant Graph Convolutional
Networks [5.249805590164902]
我々は、IsoGCNsと呼ばれるグラフ畳み込みネットワークに基づく変換不変および同変モデルのセットを提案する。
提案モデルは,幾何学的および物理シミュレーションデータに関連するタスクの最先端手法と比較して,競争力のある性能を示す。
論文 参考訳(メタデータ) (2020-05-13T13:44:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。