論文の概要: An Autonomous Large Language Model Agent for Chemical Literature Data
Mining
- arxiv url: http://arxiv.org/abs/2402.12993v1
- Date: Tue, 20 Feb 2024 13:21:46 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-21 15:21:31.439673
- Title: An Autonomous Large Language Model Agent for Chemical Literature Data
Mining
- Title(参考訳): 化学文献データマイニングのための自律型大規模言語モデルエージェント
- Authors: Kexin Chen, Hanqun Cao, Junyou Li, Yuyang Du, Menghao Guo, Xin Zeng,
Lanqing Li, Jiezhong Qiu, Pheng Ann Heng, Guangyong Chen
- Abstract要約: 本稿では,幅広い化学文献から高忠実度抽出が可能なエンドツーエンドAIエージェントフレームワークを提案する。
本フレームワークの有効性は,反応条件データの精度,リコール,F1スコアを用いて評価する。
- 参考スコア(独自算出の注目度): 60.85177362167166
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Chemical synthesis, which is crucial for advancing material synthesis and
drug discovery, impacts various sectors including environmental science and
healthcare. The rise of technology in chemistry has generated extensive
chemical data, challenging researchers to discern patterns and refine synthesis
processes. Artificial intelligence (AI) helps by analyzing data to optimize
synthesis and increase yields. However, AI faces challenges in processing
literature data due to the unstructured format and diverse writing style of
chemical literature. To overcome these difficulties, we introduce an end-to-end
AI agent framework capable of high-fidelity extraction from extensive chemical
literature. This AI agent employs large language models (LLMs) for prompt
generation and iterative optimization. It functions as a chemistry assistant,
automating data collection and analysis, thereby saving manpower and enhancing
performance. Our framework's efficacy is evaluated using accuracy, recall, and
F1 score of reaction condition data, and we compared our method with human
experts in terms of content correctness and time efficiency. The proposed
approach marks a significant advancement in automating chemical literature
extraction and demonstrates the potential for AI to revolutionize data
management and utilization in chemistry.
- Abstract(参考訳): 化学合成は物質合成と創薬の進歩に不可欠であり、環境科学や医療など様々な分野に影響を及ぼす。
化学における技術の台頭は広範な化学データを生み出し、研究者はパターンの識別と合成プロセスの洗練に挑戦している。
人工知能(AI)は、データを分析して合成を最適化し、収量を増加させる。
しかし、AIは、構造化されていないフォーマットと多様な化学文献の書き込みスタイルのために、文献データを処理する際の課題に直面している。
これらの課題を克服するために、幅広い化学文献から高忠実度抽出が可能なエンドツーエンドAIエージェントフレームワークを導入する。
このAIエージェントは、高速な生成と反復最適化のために大きな言語モデル(LLM)を使用する。
化学アシスタントとして機能し、データ収集と分析を自動化し、マンパワーを節約し、性能を向上させる。
提案手法の有効性は,反応条件データの正確性,リコール率,f1スコアを用いて評価し,コンテンツの正確性と時間効率の観点から人間の専門家と比較した。
提案手法は,化学文献抽出の自動化において重要な進歩であり,AIが化学におけるデータ管理と利用に革命をもたらす可能性を実証している。
関連論文リスト
- Retrosynthesis prediction enhanced by in-silico reaction data
augmentation [66.5643280109899]
RetroWISEは,実データから推定されるベースモデルを用いて,シリコン内反応の生成と増大を行うフレームワークである。
3つのベンチマークデータセットで、RetroWISEは最先端モデルに対して最高の全体的なパフォーマンスを達成する。
論文 参考訳(メタデータ) (2024-01-31T07:40:37Z) - AutoIE: An Automated Framework for Information Extraction from
Scientific Literature [6.235887933544583]
AutoIEは科学的なPDF文書から重要データの抽出を自動化するために設計されたフレームワークである。
我々のSBERTモデルは、CoNLL04およびADEデータセット上で87.19と89.65の高いマルコF1スコアを達成する。
この研究は、分子シーブ合成におけるデータ管理と解釈の強化の道を開くものである。
論文 参考訳(メタデータ) (2024-01-30T01:45:03Z) - Agent-based Learning of Materials Datasets from Scientific Literature [0.0]
我々は,大規模言語モデル(LLM)を利用した化学AIエージェントを開発し,自然言語テキストから構造化データセットを作成する。
化学者のAIエージェントであるEunomiaは、何十年もの科学研究論文から既存の知識を活用して、行動を計画し実行することができる。
論文 参考訳(メタデータ) (2023-12-18T20:29:58Z) - AIMS-EREA -- A framework for AI-accelerated Innovation of Materials for
Sustainability -- for Environmental Remediation and Energy Applications [0.0]
AIMS-EREAは、マテリアルサイエンス理論のベストをジェネレーティブAIのパワーと組み合わせる新しいフレームワークです。
これはまた、有害な残留物や反応の副産物の生成の可能性を排除するのに役立つ。
論文 参考訳(メタデータ) (2023-11-18T12:35:45Z) - Chemist-X: Large Language Model-empowered Agent for Reaction Condition
Recommendation in Chemical Synthesis [59.11837224347467]
Chemist-Xは、検索増強生成(RAG)技術を用いた化学合成において、反応条件レコメンデーション(RCR)タスクを自動化する。
Chemist-Xはオンラインの分子データベースを尋問し、最新の文献データベースから重要なデータを蒸留する。
Chemist-Xは化学者の作業量を大幅に減らし、より根本的で創造的な問題に集中できるようにする。
論文 参考訳(メタデータ) (2023-11-16T01:21:33Z) - ChemVise: Maximizing Out-of-Distribution Chemical Detection with the
Novel Application of Zero-Shot Learning [60.02503434201552]
本研究は,簡単な学習セットから複雑な露光の学習近似を提案する。
合成センサ応答に対するこのアプローチは, 分布外の化学分析物の検出を驚くほど改善することを示した。
論文 参考訳(メタデータ) (2023-02-09T20:19:57Z) - PcMSP: A Dataset for Scientific Action Graphs Extraction from
Polycrystalline Materials Synthesis Procedure Text [1.9573380763700712]
このデータセットは、実験段落から抽出された合成文と、エンティティの言及と文内関係を同時に含んでいる。
PcMSPコーパスの品質を保証する2段階の人間アノテーションとアノテーション間合意研究を行った。
本稿では,4つの自然言語処理タスクを紹介する。文分類,名前付きエンティティ認識,関係分類,エンティティと関係の合同抽出である。
論文 参考訳(メタデータ) (2022-10-22T09:43:54Z) - Unassisted Noise Reduction of Chemical Reaction Data Sets [59.127921057012564]
本稿では,データセットから化学的に間違ったエントリを除去するための,機械学習に基づく無支援アプローチを提案する。
その結果,クリーン化およびバランスの取れたデータセットでトレーニングしたモデルの予測精度が向上した。
論文 参考訳(メタデータ) (2021-02-02T09:34:34Z) - Retro*: Learning Retrosynthetic Planning with Neural Guided A* Search [83.22850633478302]
反合成計画(retrosynthetic planning)は、ターゲット生成物の合成に繋がる一連の反応を特定する。
既存の手法では、高いばらつきを持つロールアウトによる高価なリターン推定が必要か、品質よりも探索速度を最適化する必要がある。
本稿では,高品質な合成経路を効率よく見つけるニューラルネットワークA*ライクなアルゴリズムRetro*を提案する。
論文 参考訳(メタデータ) (2020-06-29T05:53:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。