論文の概要: An Autonomous Large Language Model Agent for Chemical Literature Data
Mining
- arxiv url: http://arxiv.org/abs/2402.12993v1
- Date: Tue, 20 Feb 2024 13:21:46 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-02-21 15:21:31.439673
- Title: An Autonomous Large Language Model Agent for Chemical Literature Data
Mining
- Title(参考訳): 化学文献データマイニングのための自律型大規模言語モデルエージェント
- Authors: Kexin Chen, Hanqun Cao, Junyou Li, Yuyang Du, Menghao Guo, Xin Zeng,
Lanqing Li, Jiezhong Qiu, Pheng Ann Heng, Guangyong Chen
- Abstract要約: 本稿では,幅広い化学文献から高忠実度抽出が可能なエンドツーエンドAIエージェントフレームワークを提案する。
本フレームワークの有効性は,反応条件データの精度,リコール,F1スコアを用いて評価する。
- 参考スコア(独自算出の注目度): 60.85177362167166
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Chemical synthesis, which is crucial for advancing material synthesis and
drug discovery, impacts various sectors including environmental science and
healthcare. The rise of technology in chemistry has generated extensive
chemical data, challenging researchers to discern patterns and refine synthesis
processes. Artificial intelligence (AI) helps by analyzing data to optimize
synthesis and increase yields. However, AI faces challenges in processing
literature data due to the unstructured format and diverse writing style of
chemical literature. To overcome these difficulties, we introduce an end-to-end
AI agent framework capable of high-fidelity extraction from extensive chemical
literature. This AI agent employs large language models (LLMs) for prompt
generation and iterative optimization. It functions as a chemistry assistant,
automating data collection and analysis, thereby saving manpower and enhancing
performance. Our framework's efficacy is evaluated using accuracy, recall, and
F1 score of reaction condition data, and we compared our method with human
experts in terms of content correctness and time efficiency. The proposed
approach marks a significant advancement in automating chemical literature
extraction and demonstrates the potential for AI to revolutionize data
management and utilization in chemistry.
- Abstract(参考訳): 化学合成は物質合成と創薬の進歩に不可欠であり、環境科学や医療など様々な分野に影響を及ぼす。
化学における技術の台頭は広範な化学データを生み出し、研究者はパターンの識別と合成プロセスの洗練に挑戦している。
人工知能(AI)は、データを分析して合成を最適化し、収量を増加させる。
しかし、AIは、構造化されていないフォーマットと多様な化学文献の書き込みスタイルのために、文献データを処理する際の課題に直面している。
これらの課題を克服するために、幅広い化学文献から高忠実度抽出が可能なエンドツーエンドAIエージェントフレームワークを導入する。
このAIエージェントは、高速な生成と反復最適化のために大きな言語モデル(LLM)を使用する。
化学アシスタントとして機能し、データ収集と分析を自動化し、マンパワーを節約し、性能を向上させる。
提案手法の有効性は,反応条件データの正確性,リコール率,f1スコアを用いて評価し,コンテンツの正確性と時間効率の観点から人間の専門家と比較した。
提案手法は,化学文献抽出の自動化において重要な進歩であり,AIが化学におけるデータ管理と利用に革命をもたらす可能性を実証している。
関連論文リスト
- A Multi-Agent System Enables Versatile Information Extraction from the Chemical Literature [8.306442315850878]
我々は,堅牢かつ自動化された化学情報抽出のためのマルチモーダル大規模言語モデル (MLLM) ベースのマルチエージェントシステムを開発した。
文献から得られた高精細なマルチモーダル化学反応画像のベンチマークデータセットにおいて,本システムは80.8%のF1スコアを達成した。
論文 参考訳(メタデータ) (2025-07-27T11:16:57Z) - ChemActor: Enhancing Automated Extraction of Chemical Synthesis Actions with LLM-Generated Data [53.78763789036172]
ケミカルエグゼキュータとして完全微調整された大規模言語モデル(LLM)であるChemActorを紹介し,非構造化実験手順と構造化動作シーケンスを変換する。
このフレームワークは、分散分散に基づくデータ選択モジュールと汎用LLMを統合し、単一の分子入力からマシン実行可能なアクションを生成する。
反応記述(R2D)と記述記述処理(D2A)のタスクの実験により、ChemActorは最先端のパフォーマンスを達成し、ベースラインモデルよりも10%高い性能を示した。
論文 参考訳(メタデータ) (2025-06-30T05:11:19Z) - Towards Large-scale Chemical Reaction Image Parsing via a Multimodal Large Language Model [4.860497022313892]
化学反応画像を機械可読データに解析するために,反応画像マルチモーダル大言語モデル(RxnIM)を導入する。
RxnIMは反応画像から重要な化学成分を抽出し、反応条件を記述したテキスト内容を解釈する。
提案手法は,各種ベンチマークでF1スコアが平均88%,文献手法が5%を超え,優れた性能を実現している。
論文 参考訳(メタデータ) (2025-03-11T08:11:23Z) - Chemical knowledge-informed framework for privacy-aware retrosynthesis learning [72.39098405805318]
現在の機械学習に基づくレトロシンセシスは、複数のソースからの反応データを1つのエッジに集め、予測モデルを訓練する。
このパラダイムは、組織の境界を越えた広範なデータ可用性を必要とするため、かなりのプライバシーリスクをもたらす。
本研究では, 化学知識インフォームド・フレームワーク (CKIF) について紹介する。
論文 参考訳(メタデータ) (2025-02-26T13:13:24Z) - Automated Retrosynthesis Planning of Macromolecules Using Large Language Models and Knowledge Graphs [11.191853171170516]
大規模言語モデル(LLM)と知識グラフを統合するエージェントシステムを提案する。
本システムは,関係する文献の検索,反応データの抽出,データベースクエリ,逆合成経路木の構築を完全自動化する。
この研究は、LLMを動力とするマクロ分子に特化して、完全に自動化された再合成計画薬を開発する最初の試みである。
論文 参考訳(メタデータ) (2025-01-15T16:06:10Z) - ChemAgent: Self-updating Library in Large Language Models Improves Chemical Reasoning [64.2106664137118]
ChemAgentは,大規模言語モデル(LLM)の性能向上を目的とした,新しいフレームワークである。
化学タスクをサブタスクに分解し、これらのサブタスクを将来のクエリに参照可能な構造化されたコレクションにコンパイルすることで開発される。
新しい問題を提示すると、ChemAgentは、私たちがメモリと呼ぶライブラリから関連する情報を検索し、精査する。
論文 参考訳(メタデータ) (2025-01-11T17:10:30Z) - Validation of the Scientific Literature via Chemputation Augmented by Large Language Models [0.0]
化学計算は、普遍的な記号言語を用いて実験を行うための化学ロボットをプログラミングするプロセスである。
大規模言語モデル(LLM)は、自然言語処理、ロボット制御、最近では化学など、様々な分野において顕著な能力を発揮している。
本稿では,合成文芸手順の自動検証を目的としたLCMベースの化学研究エージェントワークフローを提案する。
論文 参考訳(メタデータ) (2024-10-08T21:31:42Z) - BatGPT-Chem: A Foundation Large Model For Retrosynthesis Prediction [65.93303145891628]
BatGPT-Chemは150億のパラメータを持つ大規模な言語モデルであり、再合成予測の強化に最適化されている。
我々のモデルは幅広い化学知識を捉え、反応条件の正確な予測を可能にする。
この開発により、化学者は新しい化合物を十分に扱うことができ、医薬品製造と材料科学の革新サイクルを早める可能性がある。
論文 参考訳(メタデータ) (2024-08-19T05:17:40Z) - ScholarChemQA: Unveiling the Power of Language Models in Chemical Research Question Answering [54.80411755871931]
質問回答(QA)は、言語モデルの推論と知識の深さを効果的に評価する。
化学QAは、複雑な化学情報を理解しやすい形式に効果的に翻訳することで、教育と研究の両方において重要な役割を担っている。
このデータセットは、不均衡なデータ分散や、潜在的に有用である可能性のあるかなりの量の未ラベルデータを含む、典型的な現実世界の課題を反映している。
収集したデータを完全に活用して,化学的な問題に効果的に答えるQAMatchモデルを提案する。
論文 参考訳(メタデータ) (2024-07-24T01:46:55Z) - Retrosynthesis prediction enhanced by in-silico reaction data
augmentation [66.5643280109899]
RetroWISEは,実データから推定されるベースモデルを用いて,シリコン内反応の生成と増大を行うフレームワークである。
3つのベンチマークデータセットで、RetroWISEは最先端モデルに対して最高の全体的なパフォーマンスを達成する。
論文 参考訳(メタデータ) (2024-01-31T07:40:37Z) - Agent-based Learning of Materials Datasets from Scientific Literature [0.0]
我々は,大規模言語モデル(LLM)を利用した化学AIエージェントを開発し,自然言語テキストから構造化データセットを作成する。
化学者のAIエージェントであるEunomiaは、何十年もの科学研究論文から既存の知識を活用して、行動を計画し実行することができる。
論文 参考訳(メタデータ) (2023-12-18T20:29:58Z) - Predictive Chemistry Augmented with Text Retrieval [37.59545092901872]
文献から得られたテキストで予測化学を直接拡張する新しい方法であるTextReactを紹介する。
TextReactは、所定の化学反応に関連するテキスト記述を検索し、それらを反応の分子的表現と整合させる。
反応条件の推薦と1段階の逆合成という2つの化学課題の枠組みを実証的に検証した。
論文 参考訳(メタデータ) (2023-12-08T07:40:59Z) - AIMS-EREA -- A framework for AI-accelerated Innovation of Materials for
Sustainability -- for Environmental Remediation and Energy Applications [0.0]
AIMS-EREAは、マテリアルサイエンス理論のベストをジェネレーティブAIのパワーと組み合わせる新しいフレームワークです。
これはまた、有害な残留物や反応の副産物の生成の可能性を排除するのに役立つ。
論文 参考訳(メタデータ) (2023-11-18T12:35:45Z) - Chemist-X: Large Language Model-empowered Agent for Reaction Condition Recommendation in Chemical Synthesis [57.70772230913099]
Chemist-Xは、検索増強生成(RAG)技術を用いた化学合成において、反応条件レコメンデーション(RCR)タスクを自動化する。
Chemist-Xはオンラインの分子データベースを尋問し、最新の文献データベースから重要なデータを蒸留する。
Chemist-Xは化学者の作業量を大幅に減らし、より根本的で創造的な問題に集中できるようにする。
論文 参考訳(メタデータ) (2023-11-16T01:21:33Z) - ChemVise: Maximizing Out-of-Distribution Chemical Detection with the
Novel Application of Zero-Shot Learning [60.02503434201552]
本研究は,簡単な学習セットから複雑な露光の学習近似を提案する。
合成センサ応答に対するこのアプローチは, 分布外の化学分析物の検出を驚くほど改善することを示した。
論文 参考訳(メタデータ) (2023-02-09T20:19:57Z) - Retro*: Learning Retrosynthetic Planning with Neural Guided A* Search [83.22850633478302]
反合成計画(retrosynthetic planning)は、ターゲット生成物の合成に繋がる一連の反応を特定する。
既存の手法では、高いばらつきを持つロールアウトによる高価なリターン推定が必要か、品質よりも探索速度を最適化する必要がある。
本稿では,高品質な合成経路を効率よく見つけるニューラルネットワークA*ライクなアルゴリズムRetro*を提案する。
論文 参考訳(メタデータ) (2020-06-29T05:53:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。