論文の概要: BatGPT-Chem: A Foundation Large Model For Retrosynthesis Prediction
- arxiv url: http://arxiv.org/abs/2408.10285v1
- Date: Mon, 19 Aug 2024 05:17:40 GMT
- ステータス: 処理完了
- システム内更新日: 2024-08-21 18:14:26.730382
- Title: BatGPT-Chem: A Foundation Large Model For Retrosynthesis Prediction
- Title(参考訳): BatGPT-Chem:再合成予測のための基礎的な大規模モデル
- Authors: Yifei Yang, Runhan Shi, Zuchao Li, Shu Jiang, Bao-Liang Lu, Yang Yang, Hai Zhao,
- Abstract要約: BatGPT-Chemは150億のパラメータを持つ大規模な言語モデルであり、再合成予測の強化に最適化されている。
我々のモデルは幅広い化学知識を捉え、反応条件の正確な予測を可能にする。
この開発により、化学者は新しい化合物を十分に扱うことができ、医薬品製造と材料科学の革新サイクルを早める可能性がある。
- 参考スコア(独自算出の注目度): 65.93303145891628
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Retrosynthesis analysis is pivotal yet challenging in drug discovery and organic chemistry. Despite the proliferation of computational tools over the past decade, AI-based systems often fall short in generalizing across diverse reaction types and exploring alternative synthetic pathways. This paper presents BatGPT-Chem, a large language model with 15 billion parameters, tailored for enhanced retrosynthesis prediction. Integrating chemical tasks via a unified framework of natural language and SMILES notation, this approach synthesizes extensive instructional data from an expansive chemical database. Employing both autoregressive and bidirectional training techniques across over one hundred million instances, BatGPT-Chem captures a broad spectrum of chemical knowledge, enabling precise prediction of reaction conditions and exhibiting strong zero-shot capabilities. Superior to existing AI methods, our model demonstrates significant advancements in generating effective strategies for complex molecules, as validated by stringent benchmark tests. BatGPT-Chem not only boosts the efficiency and creativity of retrosynthetic analysis but also establishes a new standard for computational tools in synthetic design. This development empowers chemists to adeptly address the synthesis of novel compounds, potentially expediting the innovation cycle in drug manufacturing and materials science. We release our trial platform at \url{https://www.batgpt.net/dapp/chem}.
- Abstract(参考訳): 再合成分析は、薬物発見と有機化学において重要でありながら困難である。
過去10年間の計算ツールの普及にもかかわらず、AIベースのシステムは多種多様な反応タイプをまたいだ一般化や代替合成経路の探索に不足することが多い。
本稿では,150億のパラメータを持つ大規模言語モデルBatGPT-Chemについて述べる。
自然言語とSMILES表記の統一的な枠組みによる化学タスクの統合により、この手法は拡張的な化学データベースから広範な教育データを合成する。
BatGPT-Chemは1億のインスタンスにまたがる自己回帰的および双方向のトレーニング技術を用いて、幅広い化学知識を捉え、反応条件の正確な予測を可能にし、強力なゼロショット能力を示す。
我々のモデルは既存のAI手法よりも優れているが、厳密なベンチマークテストによって検証されるように、複雑な分子の効果的な戦略を生成する上で大きな進歩を示す。
BatGPT-Chemは、レトロシンセティック分析の効率性と創造性を向上するだけでなく、合成設計における計算ツールの新しい標準を確立している。
この開発により、化学者は新しい化合物の合成に積極的に取り組み、医薬品製造と材料科学の革新サイクルを早める可能性がある。
トライアルのプラットフォームは \url{https://www.batgpt.net/dapp/chem} で公開しています。
関連論文リスト
- PRESTO: Progressive Pretraining Enhances Synthetic Chemistry Outcomes [33.293741487835824]
MLLM(Multimodal Large Language Models)は、様々な科学分野において普及している。
しかし、現在のアプローチは化学反応を理解する上での複数の分子グラフ相互作用の重要な役割を無視することが多い。
PRESTOは、事前学習戦略とデータセット構成の包括的なベンチマークを統合することで、分子-テキストのモダリティギャップを橋渡しする新しいフレームワークである。
論文 参考訳(メタデータ) (2024-06-19T03:59:46Z) - UAlign: Pushing the Limit of Template-free Retrosynthesis Prediction with Unsupervised SMILES Alignment [51.49238426241974]
本稿では,テンプレートのないグラフ・ツー・シーケンスパイプラインであるUAlignを紹介した。
グラフニューラルネットワークとトランスフォーマーを組み合わせることで、分子固有のグラフ構造をより効果的に活用することができる。
論文 参考訳(メタデータ) (2024-03-25T03:23:03Z) - An Autonomous Large Language Model Agent for Chemical Literature Data
Mining [60.85177362167166]
本稿では,幅広い化学文献から高忠実度抽出が可能なエンドツーエンドAIエージェントフレームワークを提案する。
本フレームワークの有効性は,反応条件データの精度,リコール,F1スコアを用いて評価する。
論文 参考訳(メタデータ) (2024-02-20T13:21:46Z) - Chemist-X: Large Language Model-empowered Agent for Reaction Condition Recommendation in Chemical Synthesis [57.70772230913099]
Chemist-Xは、検索増強生成(RAG)技術を用いた化学合成において、反応条件レコメンデーション(RCR)タスクを自動化する。
Chemist-Xはオンラインの分子データベースを尋問し、最新の文献データベースから重要なデータを蒸留する。
Chemist-Xは化学者の作業量を大幅に減らし、より根本的で創造的な問題に集中できるようにする。
論文 参考訳(メタデータ) (2023-11-16T01:21:33Z) - Recent advances in artificial intelligence for retrosynthesis [29.32667622776065]
再合成は有機化学の基盤であり、化学者が物質や医薬品の製造に不慣れで新しい分子にアクセスできるようにしている。
人工知能による最近のブレークスルーは、レトロシンセシスに革命をもたらした。
論文 参考訳(メタデータ) (2023-01-14T09:29:39Z) - ChemiRise: a data-driven retrosynthesis engine [19.52621175562223]
ケミリゼは、有機化合物を迅速かつ確実に再合成する完全な経路を提案することができる。
システムは300万以上の有機反応を処理した特許データベース上で訓練された。
論文 参考訳(メタデータ) (2021-08-09T05:13:14Z) - RetroXpert: Decompose Retrosynthesis Prediction like a Chemist [60.463900712314754]
そこで我々は, テンプレートフリーな自動逆合成拡張アルゴリズムを考案した。
我々の方法はレトロシンセシスを2段階に分解する。
最先端のベースラインよりも優れている一方で、我々のモデルは化学的に合理的な解釈も提供する。
論文 参考訳(メタデータ) (2020-11-04T04:35:34Z) - Learning To Navigate The Synthetically Accessible Chemical Space Using
Reinforcement Learning [75.95376096628135]
ド・ノボ薬物設計のための強化学習(RL)を利用した新しい前方合成フレームワークを提案する。
このセットアップでは、エージェントは巨大な合成可能な化学空間をナビゲートする。
本研究は,合成可能な化学空間を根本的に拡張する上で,エンド・ツー・エンド・トレーニングが重要なパラダイムであることを示す。
論文 参考訳(メタデータ) (2020-04-26T21:40:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。