論文の概要: Towards Large-scale Chemical Reaction Image Parsing via a Multimodal Large Language Model
- arxiv url: http://arxiv.org/abs/2503.08156v1
- Date: Tue, 11 Mar 2025 08:11:23 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-12 15:45:08.936713
- Title: Towards Large-scale Chemical Reaction Image Parsing via a Multimodal Large Language Model
- Title(参考訳): 多モーダル大言語モデルによる大規模化学反応画像解析に向けて
- Authors: Yufan Chen, Ching Ting Leung, Jianwei Sun, Yong Huang, Linyan Li, Hao Chen, Hanyu Gao,
- Abstract要約: 化学反応画像を機械可読データに解析するために,反応画像マルチモーダル大言語モデル(RxnIM)を導入する。
RxnIMは反応画像から重要な化学成分を抽出し、反応条件を記述したテキスト内容を解釈する。
提案手法は,各種ベンチマークでF1スコアが平均88%,文献手法が5%を超え,優れた性能を実現している。
- 参考スコア(独自算出の注目度): 4.860497022313892
- License:
- Abstract: Artificial intelligence (AI) has demonstrated significant promise in advancing organic chemistry research; however, its effectiveness depends on the availability of high-quality chemical reaction data. Currently, most published chemical reactions are not available in machine-readable form, limiting the broader application of AI in this field. The extraction of published chemical reactions into structured databases still relies heavily on manual curation, and robust automatic parsing of chemical reaction images into machine-readable data remains a significant challenge. To address this, we introduce the Reaction Image Multimodal large language model (RxnIM), the first multimodal large language model specifically designed to parse chemical reaction images into machine-readable reaction data. RxnIM not only extracts key chemical components from reaction images but also interprets the textual content that describes reaction conditions. Together with specially designed large-scale dataset generation method to support model training, our approach achieves excellent performance, with an average F1 score of 88% on various benchmarks, surpassing literature methods by 5%. This represents a crucial step toward the automatic construction of large databases of machine-readable reaction data parsed from images in the chemistry literature, providing essential data resources for AI research in chemistry. The source code, model checkpoints, and datasets developed in this work are released under permissive licenses. An instance of the RxnIM web application can be accessed at https://huggingface.co/spaces/CYF200127/RxnIM.
- Abstract(参考訳): 人工知能(AI)は有機化学の研究を進める上で大きな可能性を証明しているが、その有効性は高品質な化学反応データの利用に依存する。
現在、ほとんどの化学反応は機械可読型では利用できないため、この分野におけるAIの幅広い応用は制限されている。
構造化データベースへの化学反応の抽出は依然として手動のキュレーションに大きく依存しており、化学反応画像の機械可読データへの堅牢な自動解析は重要な課題である。
そこで本研究では,化学反応画像の機械可読化に特化して設計された,最初のマルチモーダル大規模言語モデルであるRxnIMを提案する。
RxnIMは反応画像から重要な化学成分を抽出するだけでなく、反応条件を記述する文章の内容も解釈する。
モデルトレーニングを支援するために設計された大規模データセット生成手法とともに,本手法は,様々なベンチマークで平均88%のF1スコアを達成し,文学的手法を5%以上上回る性能を実現している。
これは、化学文献の画像から解析された機械可読性反応データの大規模なデータベースの自動構築に向けた重要なステップであり、化学におけるAI研究に不可欠なデータ資源を提供する。
この作業で開発されたソースコード、モデルチェックポイント、データセットは、寛容なライセンスの下でリリースされている。
RxnIM Webアプリケーションのインスタンスはhttps://huggingface.co/spaces/CYF 200127/RxnIMでアクセスできる。
関連論文リスト
- Learning Chemical Reaction Representation with Reactant-Product Alignment [50.28123475356234]
RAlignは、様々な有機反応関連タスクのための新しい化学反応表現学習モデルである。
反応物質と生成物との原子対応を統合することにより、反応中に起こる分子変換を識別する。
モデルが重要な機能群に集中できるように,反応中心認識型アテンション機構を導入する。
論文 参考訳(メタデータ) (2024-11-26T17:41:44Z) - Text-Augmented Multimodal LLMs for Chemical Reaction Condition Recommendation [50.639325453203504]
MM-RCRは、化学反応レコメンデーション(RCR)のためのSMILES、反応グラフ、テキストコーパスから統一的な反応表現を学習するテキスト拡張マルチモーダルLLMである。
この結果から,MM-RCRは2つのオープンベンチマークデータセット上で最先端の性能を達成できることが示唆された。
論文 参考訳(メタデータ) (2024-07-21T12:27:26Z) - OpenChemIE: An Information Extraction Toolkit For Chemistry Literature [37.23189665773341]
OpenChemIEは化学文献から反応データを抽出するツールである。
我々は、化学情報抽出の特定のタスクに対処する専門的なニューラルモデルを採用する。
我々は、パイプライン全体を評価するために、Rグループによる反応スキームの挑戦的なデータセットを慎重に注釈付けする。
論文 参考訳(メタデータ) (2024-04-01T20:16:21Z) - Contextual Molecule Representation Learning from Chemical Reaction
Knowledge [24.501564702095937]
本稿では,共通化学における原子結合規則をうまく利用した自己教師型学習フレームワークREMOを紹介する。
REMOは、文献における170万の既知の化学反応に関するグラフ/トランスフォーマーエンコーダを事前訓練する。
論文 参考訳(メタデータ) (2024-02-21T12:58:40Z) - An Autonomous Large Language Model Agent for Chemical Literature Data
Mining [60.85177362167166]
本稿では,幅広い化学文献から高忠実度抽出が可能なエンドツーエンドAIエージェントフレームワークを提案する。
本フレームワークの有効性は,反応条件データの精度,リコール,F1スコアを用いて評価する。
論文 参考訳(メタデータ) (2024-02-20T13:21:46Z) - Retrosynthesis prediction enhanced by in-silico reaction data
augmentation [66.5643280109899]
RetroWISEは,実データから推定されるベースモデルを用いて,シリコン内反応の生成と増大を行うフレームワークである。
3つのベンチマークデータセットで、RetroWISEは最先端モデルに対して最高の全体的なパフォーマンスを達成する。
論文 参考訳(メタデータ) (2024-01-31T07:40:37Z) - Predictive Chemistry Augmented with Text Retrieval [37.59545092901872]
文献から得られたテキストで予測化学を直接拡張する新しい方法であるTextReactを紹介する。
TextReactは、所定の化学反応に関連するテキスト記述を検索し、それらを反応の分子的表現と整合させる。
反応条件の推薦と1段階の逆合成という2つの化学課題の枠組みを実証的に検証した。
論文 参考訳(メタデータ) (2023-12-08T07:40:59Z) - Chemist-X: Large Language Model-empowered Agent for Reaction Condition Recommendation in Chemical Synthesis [57.70772230913099]
Chemist-Xは、検索増強生成(RAG)技術を用いた化学合成において、反応条件レコメンデーション(RCR)タスクを自動化する。
Chemist-Xはオンラインの分子データベースを尋問し、最新の文献データベースから重要なデータを蒸留する。
Chemist-Xは化学者の作業量を大幅に減らし、より根本的で創造的な問題に集中できるようにする。
論文 参考訳(メタデータ) (2023-11-16T01:21:33Z) - ReactIE: Enhancing Chemical Reaction Extraction with Weak Supervision [27.850325653751078]
構造化化学反応情報は、実験とコンピュータ支援医薬品設計のような先進的な取り組みに携わる化学者にとって重要な役割を担っている。
科学的文献から構造的反応を抽出することが重要であるにもかかわらず、この目的のためのデータアノテーションは、ドメインの専門家が必要とする多大な労力のためにコストを抑えることができる。
本稿では,2つの弱教師付き事前学習手法を組み合わせたReactIEを提案する。本手法では,テキスト内の頻繁なパターンを言語的手がかりとして用いて,化学反応の特異な特性を同定する。
論文 参考訳(メタデータ) (2023-07-04T02:52:30Z) - Rxn Hypergraph: a Hypergraph Attention Model for Chemical Reaction
Representation [70.97737157902947]
現在、化学反応を強固に表現するための普遍的で広く採用されている方法は存在しない。
ここでは、グラフに基づく分子構造の表現を利用して、ハイパーグラフアテンションニューラルネットワークアプローチを開発し、テストする。
我々はこのハイパーグラフ表現を3つの独立な化学反応データセットを用いて3つの実験で評価した。
論文 参考訳(メタデータ) (2022-01-02T12:33:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。