論文の概要: AgentCAT: An LLM Agent for Extracting and Analyzing Catalytic Reaction Data from Chemical Engineering Literature
- arxiv url: http://arxiv.org/abs/2602.18479v1
- Date: Tue, 10 Feb 2026 04:30:11 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-02 07:21:25.605175
- Title: AgentCAT: An LLM Agent for Extracting and Analyzing Catalytic Reaction Data from Chemical Engineering Literature
- Title(参考訳): AgentCAT:化学工学文献からの触媒反応データの抽出と解析のためのLLMエージェント
- Authors: Wei Yang, Zihao Liu, Tao Tan, Xiao Hu, Hong Xie, Lulu Li Xin Li, Jianyu Han, Defu Lian, Mao Ye,
- Abstract要約: 本稿では,化学工学論文から触媒反応データを抽出し,解析する大規模言語モデル (LLM) エージェントであるAgentCATを提案する。
AgentCATは、化学工学分野における長年のデータボトルネックを克服する代替手段として機能する。
- 参考スコア(独自算出の注目度): 55.66036140125613
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This paper presents a large language model (LLM) agent named AgentCAT, which extracts and analyzes catalytic reaction data from chemical engineering papers, %and supports natural language based interactive analysis of the extracted data. AgentCAT serves as an alternative to overcome the long-standing data bottleneck in chemical engineering field, and its natural language based interactive data analysis functionality is friendly to the community. AgentCAT also presents a formal abstraction and challenge analysis of the catalytic reaction data extraction task in an artificial intelligence-friendly manner. This abstraction would help the artificial intelligence community understand this problem and in turn would attract more attention to address it. Technically, the complex catalytic process leads to complicated dependency structure in catalytic reaction data with respect to elementary reaction steps, molecular behaviors, measurement evidence, etc. This dependency structure makes it challenging to guarantee the correctness and completeness of data extraction, as well as representing them for analysis. AgentCAT addresses this challenge and it makes four folds of technical contributions: (1) a schema-governed extraction pipeline with progressive schema evolution, enabling robust data extraction from chemical engineering papers; (2) a dependency-aware reaction-network knowledge graph that links catalysts/active sites, synthesis-derived descriptors, mechanistic claims with evidence, and macroscopic outcomes, preserving process coupling and traceability; (3) a general querying module that supports natural-language exploration and visualization over the constructed graph for cross-paper analysis; (4) an evaluation on $\sim$800 peer-reviewed chemical engineering publications demonstrating the effectiveness of AgentCAT.
- Abstract(参考訳): 本稿では,化学工学論文から触媒反応データを抽出し,解析するエージェントであるAgentCATについて述べる。
AgentCATは、化学工学分野における長年のボトルネックを克服する代替手段として機能し、自然言語ベースのインタラクティブなデータ分析機能はコミュニティにとって友好的である。
AgentCATはまた、AIフレンドリな方法で触媒反応データ抽出タスクの形式的抽象化と課題分析も提供する。
この抽象化は、人工知能コミュニティがこの問題を理解するのに役立つだろう。
技術的には、複雑な触媒プロセスは、塩基性反応ステップ、分子挙動、測定証拠などに関して、触媒反応データに複雑な依存性構造をもたらす。
この依存関係構造は、データ抽出の正確性と完全性を保証するとともに、解析のためにそれらを表現することを困難にしている。
AgentCATはこの課題に対処し、(1)プログレッシブ・スキーマの進化を可能とし、化学工学論文からの堅牢なデータ抽出を可能にするスキーマ統治抽出パイプライン、(2)触媒/活性部位、合成由来記述子、エビデンスによる機械的クレーム、およびマクロ的な結果、プロセス結合とトレーサビリティの保存、(3)クロスペーパー解析のために構築されたグラフ上で自然言語探索と可視化をサポートする一般的なクエリモジュール、(4)$\sim$800のピアレビューされた化学工学出版物に対する評価を行う。
関連論文リスト
- Agentic reinforcement learning empowers next-generation chemical language models for molecular design and synthesis [51.83339196548892]
ChemCraftは、知識ストレージから化学推論を分離する新しいフレームワークである。
ChemCraftは最小の推論コストで優れたパフォーマンスを実現する。
この研究は、AI支援化学のコスト効率とプライバシ保護のパラダイムを確立する。
論文 参考訳(メタデータ) (2026-01-25T04:23:34Z) - RxnCaption: Reformulating Reaction Diagram Parsing as Visual Prompt Guided Captioning [51.393018266721576]
化学反応図解析(RxnDP)のためのRxnCaptionフレームワークを提案する。
本フレームワークは,従来の座標予測による解析処理を画像キャプション問題に再構成する。
我々は,BBox and Index as Visual Prompt (BIVP) という,最先端の分子検出器である MolYOLO を用いて,分子境界ボックスやインデックスを直接入力画像上に描画する戦略を紹介した。
論文 参考訳(メタデータ) (2025-11-04T09:08:44Z) - Benchmarking Agentic Systems in Automated Scientific Information Extraction with ChemX [2.1779971965303617]
ChemXは、ナノマテリアルと小さな分子に焦点を当てた、手動でキュレートされ、ドメインに精通した10のデータセットの集合である。
これらのデータセットは化学における自動抽出手法を厳格に評価し、拡張するために設計されている。
本稿では,ChatGPTエージェントや化学特異的データ抽出エージェントなど,最先端のエージェントシステムとの比較を行った。
論文 参考訳(メタデータ) (2025-10-01T11:50:11Z) - A Multi-Agent System Enables Versatile Information Extraction from the Chemical Literature [8.306442315850878]
我々は,堅牢かつ自動化された化学情報抽出のためのマルチモーダル大規模言語モデル (MLLM) ベースのマルチエージェントシステムを開発した。
文献から得られた高精細なマルチモーダル化学反応画像のベンチマークデータセットにおいて,本システムは80.8%のF1スコアを達成した。
論文 参考訳(メタデータ) (2025-07-27T11:16:57Z) - ChemActor: Enhancing Automated Extraction of Chemical Synthesis Actions with LLM-Generated Data [53.78763789036172]
ケミカルエグゼキュータとして完全微調整された大規模言語モデル(LLM)であるChemActorを紹介し,非構造化実験手順と構造化動作シーケンスを変換する。
このフレームワークは、分散分散に基づくデータ選択モジュールと汎用LLMを統合し、単一の分子入力からマシン実行可能なアクションを生成する。
反応記述(R2D)と記述記述処理(D2A)のタスクの実験により、ChemActorは最先端のパフォーマンスを達成し、ベースラインモデルよりも10%高い性能を示した。
論文 参考訳(メタデータ) (2025-06-30T05:11:19Z) - DrugPilot: LLM-based Parameterized Reasoning Agent for Drug Discovery [54.79763887844838]
大規模言語モデル(LLM)と自律エージェントの統合は、自動推論とタスク実行を通じて科学的発見を促進する大きな可能性を秘めている。
本稿では,薬物発見におけるエンドツーエンド科学のために設計されたパラメータ化推論アーキテクチャを備えたLSMベースのエージェントシステムであるDrarmPilotを紹介する。
DrugPilot は ReAct や LoT のような最先端のエージェントよりも優れており、タスク完了率は98.0%、93.5%、64.0%である。
論文 参考訳(メタデータ) (2025-05-20T05:18:15Z) - A Machine Learning and Explainable AI Framework Tailored for Unbalanced Experimental Catalyst Discovery [10.92613600218535]
各種成分の触媒収率を正確に分類するために,堅牢な機械学習と説明可能なAI(XAI)フレームワークを導入する。
このフレームワークは、触媒データの不足と不均衡を処理するために設計された一連のMLプラクティスを組み合わせる。
このような知見は, 新規触媒の開発・同定において, 優れた性能を有する化学者を支援することができると信じている。
論文 参考訳(メタデータ) (2024-07-10T13:09:53Z) - ChemMiner: A Large Language Model Agent System for Chemical Literature Data Mining [56.15126714863963]
ChemMinerは、文学から化学データを抽出するエンドツーエンドのフレームワークである。
ChemMinerには、コア参照マッピングのためのテキスト分析エージェント、非テキスト情報抽出のためのマルチモーダルエージェント、データ生成のための合成分析エージェントの3つの特殊エージェントが組み込まれている。
実験の結果,ヒト化学者に匹敵する反応同定率を示すとともに,高い精度,リコール,F1スコアで処理時間を著しく短縮した。
論文 参考訳(メタデータ) (2024-02-20T13:21:46Z) - Chemist-X: Large Language Model-empowered Agent for Reaction Condition Recommendation in Chemical Synthesis [55.30328162764292]
Chemist-Xは、化学合成における反応条件最適化(RCO)タスクを自動化する包括的なAIエージェントである。
このエージェントは、検索強化世代(RAG)技術とAI制御のウェットラブ実験を実行する。
我々の自動ウェットラブ実験の結果は、LLMが制御するエンドツーエンドの操作を、ロボットに人間がいない状態で行うことで達成され、Chemist-Xの自動運転実験における能力が証明された。
論文 参考訳(メタデータ) (2023-11-16T01:21:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。