論文の概要: A Pre-trained Reaction Embedding Descriptor Capturing Bond Transformation Patterns
- arxiv url: http://arxiv.org/abs/2601.03689v1
- Date: Wed, 07 Jan 2026 08:24:08 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-08 18:12:46.159249
- Title: A Pre-trained Reaction Embedding Descriptor Capturing Bond Transformation Patterns
- Title(参考訳): ボンド変換パターンをキャプチャする記述子を組み込んだ事前学習型反応
- Authors: Weiqi Liu, Fenglei Cao, Yuan Qi, Li-Cheng Xu,
- Abstract要約: 本研究は、RXNGraphormer由来の新規な反応レベル記述子であるRXNEmbを紹介する。
我々は、USPTO-50kデータセットをデータ駆動で再クラスタ化することで、その実用性を実証する。
RXNEmbは、反応のフィンガープリントと分析のための強力で解釈可能なツールとして機能する。
- 参考スコア(独自算出の注目度): 4.8838428804671326
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: With the rise of data-driven reaction prediction models, effective reaction descriptors are crucial for bridging the gap between real-world chemistry and digital representations. However, general-purpose, reaction-wise descriptors remain scarce. This study introduces RXNEmb, a novel reaction-level descriptor derived from RXNGraphormer, a model pre-trained to distinguish real reactions from fictitious ones with erroneous bond changes, thereby learning intrinsic bond formation and cleavage patterns. We demonstrate its utility by data-driven re-clustering of the USPTO-50k dataset, yielding a classification that more directly reflects bond-change similarities than rule-based categories. Combined with dimensionality reduction, RXNEmb enables visualization of reaction space diversity. Furthermore, attention weight analysis reveals the model's focus on chemically critical sites, providing mechanistic insight. RXNEmb serves as a powerful, interpretable tool for reaction fingerprinting and analysis, paving the way for more data-centric approaches in reaction analysis and discovery.
- Abstract(参考訳): データ駆動型反応予測モデルの台頭により、実世界の化学とデジタル表現のギャップを埋めるために効果的な反応記述子は不可欠である。
しかし、汎用的で反応性の高い記述子はほとんど残っていない。
本研究では,RXNGraphormerから派生した新規な反応レベル記述子であるRXNEmbを紹介した。
我々は、USPTO-50kデータセットをデータ駆動で再クラスタ化することで、ルールベースのカテゴリよりも直接的に結合変化の類似性を反映した分類を実現する。
次元減少と組み合わせて、RXNEmbは反応空間の多様性の可視化を可能にする。
さらに、注意重み分析により、このモデルが化学的に重要な部位に焦点を当てていることが明らかになり、力学的な洞察を与えている。
RXNEmbは、反応のフィンガープリントと分析のための強力で解釈可能なツールとして機能し、反応分析と発見におけるデータ中心のアプローチの道を開く。
関連論文リスト
- Reaction Prediction via Interaction Modeling of Symmetric Difference Shingle Sets [4.597922051722059]
化学反応予測のための新しい機械学習モデルReaDISHを提案する。
相互作用認識機能を導入しながら、置換不変表現を学習する。
R$2$の順に平均8.76%の改善が加えられた。
論文 参考訳(メタデータ) (2025-11-09T12:29:16Z) - RxnCaption: Reformulating Reaction Diagram Parsing as Visual Prompt Guided Captioning [51.393018266721576]
化学反応図解析(RxnDP)のためのRxnCaptionフレームワークを提案する。
本フレームワークは,従来の座標予測による解析処理を画像キャプション問題に再構成する。
我々は,BBox and Index as Visual Prompt (BIVP) という,最先端の分子検出器である MolYOLO を用いて,分子境界ボックスやインデックスを直接入力画像上に描画する戦略を紹介した。
論文 参考訳(メタデータ) (2025-11-04T09:08:44Z) - Chemical knowledge-informed framework for privacy-aware retrosynthesis learning [72.39098405805318]
現在の機械学習に基づくレトロシンセシスは、複数のソースからの反応データを1つのエッジに集め、予測モデルを訓練する。
このパラダイムは、組織の境界を越えた広範なデータ可用性を必要とするため、かなりのプライバシーリスクをもたらす。
本研究では, 化学知識インフォームド・フレームワーク (CKIF) について紹介する。
論文 参考訳(メタデータ) (2025-02-26T13:13:24Z) - Learning Chemical Reaction Representation with Reactant-Product Alignment [50.28123475356234]
RAlignは、様々な有機反応関連タスクのための新しい化学反応表現学習モデルである。
反応物質と生成物との原子対応を統合することにより、反応中に起こる分子変換を識別する。
モデルが重要な機能群に集中できるように,反応中心認識型アテンション機構を導入する。
論文 参考訳(メタデータ) (2024-11-26T17:41:44Z) - log-RRIM: Yield Prediction via Local-to-global Reaction Representation Learning and Interaction Modeling [6.310759215182946]
log-RRIMは、化学反応の収量を予測するために設計された革新的なグラフトランスフォーマーベースのフレームワークである。
log-RRIMの重要な特徴は、試薬と反応中心の相互作用に焦点を当てたクロスアテンション機構の統合である。
Log-RRIMは、特に中~高収率反応において、我々の実験において優れた性能を示す。
論文 参考訳(メタデータ) (2024-10-20T18:35:56Z) - Beyond Major Product Prediction: Reproducing Reaction Mechanisms with
Machine Learning Models Trained on a Large-Scale Mechanistic Dataset [10.968137261042715]
有機反応の機械的理解は、反応の発生、不純物予測、そして原則として反応発見を促進する。
いくつかの機械学習モデルは、反応生成物を予測するタスクに対処しようとしているが、反応機構を予測するための拡張は、対応する力学データセットの欠如によって妨げられている。
実験によって報告された反応物質と生成物の中間体を専門家の反応テンプレートを用いて入力し、その結果の5,184,184個の基本ステップに基づいて機械学習モデルを訓練することにより、そのようなデータセットを構築する。
論文 参考訳(メタデータ) (2024-03-07T15:26:23Z) - On the importance of catalyst-adsorbate 3D interactions for relaxed
energy predictions [98.70797778496366]
吸着剤の相対的な位置を無視しながら,OC20データセットの緩和エネルギーを予測できるかどうかを検討する。
結合サイト情報の削除は,期待通りに精度を低下させるが,修正モデルは極めて良好なMAEで緩和エネルギーを予測することができる。
論文 参考訳(メタデータ) (2023-10-10T14:57:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。