論文の概要: Uni-Mol3: A Multi-Molecular Foundation Model for Advancing Organic Reaction Modeling
- arxiv url: http://arxiv.org/abs/2508.00920v1
- Date: Wed, 30 Jul 2025 02:38:52 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-05 18:25:21.623781
- Title: Uni-Mol3: A Multi-Molecular Foundation Model for Advancing Organic Reaction Modeling
- Title(参考訳): Uni-Mol3: 有機反応モデリングを促進するための多分子基盤モデル
- Authors: Lirong Wu, Junjie Wang, Zhifeng Gao, Xiaohong Ji, Rong Zhu, Xinyu Li, Linfeng Zhang, Guolin Ke, Weinan E,
- Abstract要約: 本稿では,多分子反応モデリングに階層的パイプラインを用いた新しいディープラーニングフレームワークUni-Mol3を紹介する。
中心となるUni-Mol3は、分子やその他の特徴の3D構造を離散トークンにエンコードするマルチスケール分子トークン化器(Mol-Tokenizer)を採用している。
迅速な下流の微調整により、Uni-Mol3は多様な有機反応タスクにおいて例外的な性能を示す。
- 参考スコア(独自算出の注目度): 36.36866930946212
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Organic reaction, the foundation of modern chemical industry, is crucial for new material development and drug discovery. However, deciphering reaction mechanisms and modeling multi-molecular relationships remain formidable challenges due to the complexity of molecular dynamics. While several state-of-the-art models like Uni-Mol2 have revolutionized single-molecular representation learning, their extension to multi-molecular systems, where chemical reactions inherently occur, has been underexplored. This paper introduces Uni-Mol3, a novel deep learning framework that employs a hierarchical pipeline for multi-molecular reaction modeling. At its core, Uni-Mol3 adopts a multi-scale molecular tokenizer (Mol-Tokenizer) that encodes 3D structures of molecules and other features into discrete tokens, creating a 3D-aware molecular language. The framework innovatively combines two pre-training stages: molecular pre-training to learn the molecular grammars and reaction pre-training to capture fundamental reaction principles, forming a progressive learning paradigm from single- to multi-molecular systems. With prompt-aware downstream fine-tuning, Uni-Mol3 demonstrates exceptional performance in diverse organic reaction tasks and supports multi-task prediction with strong generalizability. Experimental results across 10 datasets spanning 4 downstream tasks show that Uni-Mol3 outperforms existing methods, validating its effectiveness in modeling complex organic reactions. This work not only ushers in an alternative paradigm for multi-molecular computational modeling but also charts a course for intelligent organic reaction by bridging molecular representation with reaction mechanism understanding.
- Abstract(参考訳): 近代化学産業の基盤である有機反応は、新しい物質開発と創薬に不可欠である。
しかし、分子動力学の複雑さのため、解読反応機構や多分子関係のモデル化は依然として困難な課題である。
Uni-Mol2のような最先端モデルは単一分子表現学習に革命をもたらしたが、化学反応が本質的に起こる多分子系への拡張は過小評価されている。
本稿では,多分子反応モデリングに階層的パイプラインを用いた新しいディープラーニングフレームワークUni-Mol3を紹介する。
中心となるUni-Mol3は、分子やその他の特徴の3D構造を離散トークンに符号化し、3D対応の分子言語を作成する、マルチスケールな分子トークン化器(Mol-Tokenizer)を採用している。
このフレームワークは、2つの事前学習段階を革新的に組み合わせている。分子文法を学ぶための分子事前学習と、基本的な反応原理を捉えるための反応事前学習である。
迅速な下流の微調整により、Uni-Mol3は多様な有機反応タスクにおいて例外的な性能を示し、強い一般化性を持つマルチタスク予測をサポートする。
4つの下流タスクにまたがる10のデータセットに対する実験結果から、Uni-Mol3は既存の手法よりも優れており、複雑な有機反応をモデル化する上での有効性が検証されている。
この研究は、多分子計算モデリングの代替パラダイムであるだけでなく、反応機構の理解による分子表現をブリッジすることで、インテリジェントな有機反応のコースも表している。
関連論文リスト
- Multi-Modal Molecular Representation Learning via Structure Awareness [19.813872931221546]
構造認識に基づくマルチモーダル自己制御分子表現事前学習フレームワーク(MMSA)を提案する。
MMSAは分子間の不変知識を活用することにより、分子グラフ表現を強化する。
MoleculeNetベンチマークで最先端のパフォーマンスを実現しており、平均的なROC-AUC改善はベースラインメソッドよりも1.8%から9.6%まで改善されている。
論文 参考訳(メタデータ) (2025-05-09T08:37:29Z) - Knowledge-aware contrastive heterogeneous molecular graph learning [77.94721384862699]
分子グラフを不均一な分子グラフ学習(KCHML)に符号化するパラダイムシフトを提案する。
KCHMLは、不均一な分子グラフと二重メッセージパッシング機構によって強化された3つの異なるグラフビュー-分子、元素、薬理学-を通して分子を概念化する。
この設計は、プロパティ予測やドラッグ・ドラッグ・インタラクション(DDI)予測などの下流タスクに対する包括的な表現を提供する。
論文 参考訳(メタデータ) (2025-02-17T11:53:58Z) - D3MES: Diffusion Transformer with multihead equivariant self-attention for 3D molecule generation [1.3791394805787949]
本稿では,拡散モデルDiffusion Transformerとマルチヘッド同型自己アテンションを組み合わせた3次元分子生成のための拡散モデルを提案する。
この方法は、2つの主要な課題に対処する: 水素原子を除去した後、分子の表現を学ぶことによって生成分子に水素原子を正しく取り付けること; 同時に複数のクラスにまたがる分子を生成できない既存のモデルの限界を克服すること。
論文 参考訳(メタデータ) (2025-01-13T06:16:11Z) - Learning Chemical Reaction Representation with Reactant-Product Alignment [50.28123475356234]
RAlignは、様々な有機反応関連タスクのための新しい化学反応表現学習モデルである。
反応物質と生成物との原子対応を統合することにより、反応中に起こる分子変換を識別する。
モデルが重要な機能群に集中できるように,反応中心認識型アテンション機構を導入する。
論文 参考訳(メタデータ) (2024-11-26T17:41:44Z) - UniIF: Unified Molecule Inverse Folding [67.60267592514381]
全分子の逆折り畳みのための統一モデルUniIFを提案する。
提案手法は,全タスクにおける最先端手法を超越した手法である。
論文 参考訳(メタデータ) (2024-05-29T10:26:16Z) - Learning Over Molecular Conformer Ensembles: Datasets and Benchmarks [44.934084652800976]
コンフォーマーアンサンブルを用いた学習の可能性を徹底的に評価するための,最初のMoleculAR Conformer Ensemble Learningベンチマークを導入する。
その結果,コンバータ空間からの直接学習は,様々なタスクやモデルの性能を向上させることができることがわかった。
論文 参考訳(メタデータ) (2023-09-29T20:06:46Z) - Bridging the Gap between Chemical Reaction Pretraining and Conditional
Molecule Generation with a Unified Model [3.3031562864527664]
反応表現学習と分子生成の両課題に対処する統合フレームワークを提案する。
有機化学機構にインスパイアされた我々は,モデルに誘導バイアスを組み込むことのできる,新しい事前学習フレームワークを開発した。
我々のフレームワークは、ダウンストリームタスクに挑戦する上で、最先端の結果を達成する。
論文 参考訳(メタデータ) (2023-03-13T10:06:41Z) - Improving Molecular Pretraining with Complementary Featurizations [20.86159731100242]
分子プレトレーニング(英: molecular pretraining)は、計算化学と薬物発見における様々な課題を解決するためのパラダイムである。
化学情報を異なる方法で伝達できることが示される。
我々は, 簡易で効果的な分子事前学習フレームワーク(MOCO)を提案する。
論文 参考訳(メタデータ) (2022-09-29T21:11:09Z) - A Molecular Multimodal Foundation Model Associating Molecule Graphs with
Natural Language [63.60376252491507]
本稿では,分子グラフとその意味的関連テキストデータから事前学習した分子マルチモーダル基礎モデルを提案する。
我々のモデルは、生物学、化学、材料、環境、医学などの分野において、AIを動力とする分野に幅広い影響を与えるだろうと考えています。
論文 参考訳(メタデータ) (2022-09-12T00:56:57Z) - Scalable Fragment-Based 3D Molecular Design with Reinforcement Learning [68.8204255655161]
分子構築に階層的エージェントを用いるスケーラブルな3D設計のための新しいフレームワークを提案する。
様々な実験において、エネルギーのみを考慮に入れたエージェントが、100以上の原子を持つ分子を効率よく生成できることが示されている。
論文 参考訳(メタデータ) (2022-02-01T18:54:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。