論文の概要: An Autonomous Large Language Model Agent for Chemical Literature Data
Mining
- arxiv url: http://arxiv.org/abs/2402.12993v1
- Date: Tue, 20 Feb 2024 13:21:46 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-21 15:21:31.439673
- Title: An Autonomous Large Language Model Agent for Chemical Literature Data
Mining
- Title(参考訳): 化学文献データマイニングのための自律型大規模言語モデルエージェント
- Authors: Kexin Chen, Hanqun Cao, Junyou Li, Yuyang Du, Menghao Guo, Xin Zeng,
Lanqing Li, Jiezhong Qiu, Pheng Ann Heng, Guangyong Chen
- Abstract要約: 本稿では,幅広い化学文献から高忠実度抽出が可能なエンドツーエンドAIエージェントフレームワークを提案する。
本フレームワークの有効性は,反応条件データの精度,リコール,F1スコアを用いて評価する。
- 参考スコア(独自算出の注目度): 60.85177362167166
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Chemical synthesis, which is crucial for advancing material synthesis and
drug discovery, impacts various sectors including environmental science and
healthcare. The rise of technology in chemistry has generated extensive
chemical data, challenging researchers to discern patterns and refine synthesis
processes. Artificial intelligence (AI) helps by analyzing data to optimize
synthesis and increase yields. However, AI faces challenges in processing
literature data due to the unstructured format and diverse writing style of
chemical literature. To overcome these difficulties, we introduce an end-to-end
AI agent framework capable of high-fidelity extraction from extensive chemical
literature. This AI agent employs large language models (LLMs) for prompt
generation and iterative optimization. It functions as a chemistry assistant,
automating data collection and analysis, thereby saving manpower and enhancing
performance. Our framework's efficacy is evaluated using accuracy, recall, and
F1 score of reaction condition data, and we compared our method with human
experts in terms of content correctness and time efficiency. The proposed
approach marks a significant advancement in automating chemical literature
extraction and demonstrates the potential for AI to revolutionize data
management and utilization in chemistry.
- Abstract(参考訳): 化学合成は物質合成と創薬の進歩に不可欠であり、環境科学や医療など様々な分野に影響を及ぼす。
化学における技術の台頭は広範な化学データを生み出し、研究者はパターンの識別と合成プロセスの洗練に挑戦している。
人工知能(AI)は、データを分析して合成を最適化し、収量を増加させる。
しかし、AIは、構造化されていないフォーマットと多様な化学文献の書き込みスタイルのために、文献データを処理する際の課題に直面している。
これらの課題を克服するために、幅広い化学文献から高忠実度抽出が可能なエンドツーエンドAIエージェントフレームワークを導入する。
このAIエージェントは、高速な生成と反復最適化のために大きな言語モデル(LLM)を使用する。
化学アシスタントとして機能し、データ収集と分析を自動化し、マンパワーを節約し、性能を向上させる。
提案手法の有効性は,反応条件データの正確性,リコール率,f1スコアを用いて評価し,コンテンツの正確性と時間効率の観点から人間の専門家と比較した。
提案手法は,化学文献抽出の自動化において重要な進歩であり,AIが化学におけるデータ管理と利用に革命をもたらす可能性を実証している。
関連論文リスト
- Validation of the Scientific Literature via Chemputation Augmented by Large Language Models [0.0]
化学計算は、普遍的な記号言語を用いて実験を行うための化学ロボットをプログラミングするプロセスである。
大規模言語モデル(LLM)は、自然言語処理、ロボット制御、最近では化学など、様々な分野において顕著な能力を発揮している。
本稿では,合成文芸手順の自動検証を目的としたLCMベースの化学研究エージェントワークフローを提案する。
論文 参考訳(メタデータ) (2024-10-08T21:31:42Z) - BatGPT-Chem: A Foundation Large Model For Retrosynthesis Prediction [65.93303145891628]
BatGPT-Chemは150億のパラメータを持つ大規模な言語モデルであり、再合成予測の強化に最適化されている。
我々のモデルは幅広い化学知識を捉え、反応条件の正確な予測を可能にする。
この開発により、化学者は新しい化合物を十分に扱うことができ、医薬品製造と材料科学の革新サイクルを早める可能性がある。
論文 参考訳(メタデータ) (2024-08-19T05:17:40Z) - Retrosynthesis prediction enhanced by in-silico reaction data
augmentation [66.5643280109899]
RetroWISEは,実データから推定されるベースモデルを用いて,シリコン内反応の生成と増大を行うフレームワークである。
3つのベンチマークデータセットで、RetroWISEは最先端モデルに対して最高の全体的なパフォーマンスを達成する。
論文 参考訳(メタデータ) (2024-01-31T07:40:37Z) - Agent-based Learning of Materials Datasets from Scientific Literature [0.0]
我々は,大規模言語モデル(LLM)を利用した化学AIエージェントを開発し,自然言語テキストから構造化データセットを作成する。
化学者のAIエージェントであるEunomiaは、何十年もの科学研究論文から既存の知識を活用して、行動を計画し実行することができる。
論文 参考訳(メタデータ) (2023-12-18T20:29:58Z) - AIMS-EREA -- A framework for AI-accelerated Innovation of Materials for
Sustainability -- for Environmental Remediation and Energy Applications [0.0]
AIMS-EREAは、マテリアルサイエンス理論のベストをジェネレーティブAIのパワーと組み合わせる新しいフレームワークです。
これはまた、有害な残留物や反応の副産物の生成の可能性を排除するのに役立つ。
論文 参考訳(メタデータ) (2023-11-18T12:35:45Z) - Chemist-X: Large Language Model-empowered Agent for Reaction Condition Recommendation in Chemical Synthesis [57.70772230913099]
Chemist-Xは、検索増強生成(RAG)技術を用いた化学合成において、反応条件レコメンデーション(RCR)タスクを自動化する。
Chemist-Xはオンラインの分子データベースを尋問し、最新の文献データベースから重要なデータを蒸留する。
Chemist-Xは化学者の作業量を大幅に減らし、より根本的で創造的な問題に集中できるようにする。
論文 参考訳(メタデータ) (2023-11-16T01:21:33Z) - ChemVise: Maximizing Out-of-Distribution Chemical Detection with the
Novel Application of Zero-Shot Learning [60.02503434201552]
本研究は,簡単な学習セットから複雑な露光の学習近似を提案する。
合成センサ応答に対するこのアプローチは, 分布外の化学分析物の検出を驚くほど改善することを示した。
論文 参考訳(メタデータ) (2023-02-09T20:19:57Z) - Retro*: Learning Retrosynthetic Planning with Neural Guided A* Search [83.22850633478302]
反合成計画(retrosynthetic planning)は、ターゲット生成物の合成に繋がる一連の反応を特定する。
既存の手法では、高いばらつきを持つロールアウトによる高価なリターン推定が必要か、品質よりも探索速度を最適化する必要がある。
本稿では,高品質な合成経路を効率よく見つけるニューラルネットワークA*ライクなアルゴリズムRetro*を提案する。
論文 参考訳(メタデータ) (2020-06-29T05:53:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。