論文の概要: A Multi-Agent System Enables Versatile Information Extraction from the Chemical Literature
- arxiv url: http://arxiv.org/abs/2507.20230v2
- Date: Tue, 29 Jul 2025 02:55:37 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-30 12:52:36.85206
- Title: A Multi-Agent System Enables Versatile Information Extraction from the Chemical Literature
- Title(参考訳): 化学文献からの揮発性情報抽出が可能なマルチエージェントシステム
- Authors: Yufan Chen, Ching Ting Leung, Bowen Yu, Jianwei Sun, Yong Huang, Linyan Li, Hao Chen, Hanyu Gao,
- Abstract要約: 我々は,堅牢かつ自動化された化学情報抽出のためのマルチモーダル大規模言語モデル (MLLM) ベースのマルチエージェントシステムを開発した。
文献から得られた高精細なマルチモーダル化学反応画像のベンチマークデータセットにおいて,本システムは80.8%のF1スコアを達成した。
- 参考スコア(独自算出の注目度): 8.306442315850878
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: To fully expedite AI-powered chemical research, high-quality chemical databases are the cornerstone. Automatic extraction of chemical information from the literature is essential for constructing reaction databases, but it is currently limited by the multimodality and style variability of chemical information. In this work, we developed a multimodal large language model (MLLM)-based multi-agent system for robust and automated chemical information extraction. It utilizes the MLLM's strong reasoning capability to understand the structure of diverse chemical graphics, decompose the extraction task into sub-tasks, and coordinate a set of specialized agents, each combining the capabilities of the MLLM with the precise, domain-specific strengths of dedicated tools, to solve them accurately and integrate the results into a unified output. Our system achieved an F1 score of 80.8% on a benchmark dataset of sophisticated multimodal chemical reaction graphics from the literature, surpassing the previous state-of-the-art model (F1 score of 35.6%) by a significant margin. Additionally, it demonstrated consistent improvements in key sub-tasks, including molecular image recognition, reaction image parsing, named entity recognition and text-based reaction extraction. This work is a critical step toward automated chemical information extraction into structured datasets, which will be a strong promoter of AI-driven chemical research.
- Abstract(参考訳): AIを利用した化学研究を徹底的に進めるためには、高品質な化学データベースが基礎となる。
文献からの化学情報の自動抽出は, 反応データベースの構築に不可欠であるが, 現在, 化学情報の多様性, スタイルの変動性に制限されている。
本研究では, マルチモーダル大規模言語モデル (MLLM) を用いた, 堅牢かつ自動的な化学情報抽出システムを開発した。
MLLMの強力な推論能力を利用して、多様な化学画像の構造を理解し、抽出タスクをサブタスクに分解し、特殊エージェントのセットを調整し、それぞれがMLLMの能力と専門ツールの正確なドメイン固有の強度を組み合わせて、それらを正確に解き、結果を統一された出力に統合する。
文献から得られた高精細なマルチモーダル化学反応画像のベンチマークデータセットでは,F1スコアが80.8%に達し,従来の最先端モデル(F1スコアは35.6%)をかなり上回った。
さらに、分子画像認識、反応画像解析、名前付きエンティティ認識、テキストベースの反応抽出など、キーサブタスクにおける一貫した改善が示された。
この研究は、AI駆動の化学研究の強力な推進者となる構造化データセットへの化学情報の自動抽出に向けた重要なステップである。
関連論文リスト
- ChemActor: Enhancing Automated Extraction of Chemical Synthesis Actions with LLM-Generated Data [53.78763789036172]
ケミカルエグゼキュータとして完全微調整された大規模言語モデル(LLM)であるChemActorを紹介し,非構造化実験手順と構造化動作シーケンスを変換する。
このフレームワークは、分散分散に基づくデータ選択モジュールと汎用LLMを統合し、単一の分子入力からマシン実行可能なアクションを生成する。
反応記述(R2D)と記述記述処理(D2A)のタスクの実験により、ChemActorは最先端のパフォーマンスを達成し、ベースラインモデルよりも10%高い性能を示した。
論文 参考訳(メタデータ) (2025-06-30T05:11:19Z) - Towards Large-scale Chemical Reaction Image Parsing via a Multimodal Large Language Model [4.860497022313892]
化学反応画像を機械可読データに解析するために,反応画像マルチモーダル大言語モデル(RxnIM)を導入する。
RxnIMは反応画像から重要な化学成分を抽出し、反応条件を記述したテキスト内容を解釈する。
提案手法は,各種ベンチマークでF1スコアが平均88%,文献手法が5%を超え,優れた性能を実現している。
論文 参考訳(メタデータ) (2025-03-11T08:11:23Z) - Automated Retrosynthesis Planning of Macromolecules Using Large Language Models and Knowledge Graphs [11.191853171170516]
大規模言語モデル(LLM)と知識グラフを統合するエージェントシステムを提案する。
本システムは,関係する文献の検索,反応データの抽出,データベースクエリ,逆合成経路木の構築を完全自動化する。
この研究は、LLMを動力とするマクロ分子に特化して、完全に自動化された再合成計画薬を開発する最初の試みである。
論文 参考訳(メタデータ) (2025-01-15T16:06:10Z) - ChemMiner: A Large Language Model Agent System for Chemical Literature Data Mining [56.15126714863963]
ChemMinerは、文学から化学データを抽出するエンドツーエンドのフレームワークである。
ChemMinerには、コア参照マッピングのためのテキスト分析エージェント、非テキスト情報抽出のためのマルチモーダルエージェント、データ生成のための合成分析エージェントの3つの特殊エージェントが組み込まれている。
実験の結果,ヒト化学者に匹敵する反応同定率を示すとともに,高い精度,リコール,F1スコアで処理時間を著しく短縮した。
論文 参考訳(メタデータ) (2024-02-20T13:21:46Z) - Chemist-X: Large Language Model-empowered Agent for Reaction Condition Recommendation in Chemical Synthesis [55.30328162764292]
Chemist-Xは、化学合成における反応条件最適化(RCO)タスクを自動化する包括的なAIエージェントである。
このエージェントは、検索強化世代(RAG)技術とAI制御のウェットラブ実験を実行する。
我々の自動ウェットラブ実験の結果は、LLMが制御するエンドツーエンドの操作を、ロボットに人間がいない状態で行うことで達成され、Chemist-Xの自動運転実験における能力が証明された。
論文 参考訳(メタデータ) (2023-11-16T01:21:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。