Fugu-MT 論文翻訳(概要): Tooling or Not Tooling? The Impact of Tools on Language Agents for Chemistry Problem Solving

論文の概要: Tooling or Not Tooling? The Impact of Tools on Language Agents for Chemistry Problem Solving

arxiv url: http://arxiv.org/abs/2411.07228v1
Date: Mon, 11 Nov 2024 18:46:37 GMT
ステータス: 翻訳完了
システム内更新日: 2024-11-28 17:07:46.612859
Title: Tooling or Not Tooling? The Impact of Tools on Language Agents for Chemistry Problem Solving
Title（参考訳）: ツールかツールか? 化学問題解決のための言語エージェントに及ぼすツールの影響
Authors: Botao Yu, Frazier N. Baker, Ziru Chen, Garrett Herb, Boyu Gou, Daniel Adu-Ampratwum, Xia Ning, Huan Sun,
Abstract要約: 我々はChemCrow上での化学強化剤であるChemAgentを開発した。驚いたことに、ChemAgentはツールなしでも、ベースLLMを一貫して上回っているわけではない。合成予測のような特殊な化学タスクでは、特殊ツールでエージェントを増強すべきである。試験のような一般的な化学問題では、エージェントの化学知識を正しく推論する能力がより重要である。
参考スコア（独自算出の注目度）: 10.963114215850515
License: http://creativecommons.org/licenses/by/4.0/
Abstract: To enhance large language models (LLMs) for chemistry problem solving, several LLM-based agents augmented with tools have been proposed, such as ChemCrow and Coscientist. However, their evaluations are narrow in scope, leaving a large gap in understanding the benefits of tools across diverse chemistry tasks. To bridge this gap, we develop ChemAgent, an enhanced chemistry agent over ChemCrow, and conduct a comprehensive evaluation of its performance on both specialized chemistry tasks and general chemistry questions. Surprisingly, ChemAgent does not consistently outperform its base LLMs without tools. Our error analysis with a chemistry expert suggests that: For specialized chemistry tasks, such as synthesis prediction, we should augment agents with specialized tools; however, for general chemistry questions like those in exams, agents' ability to reason correctly with chemistry knowledge matters more, and tool augmentation does not always help.
Abstract（参考訳）: 化学問題解決のための大規模言語モデル(LLM)を強化するために、ChemCrowやCoscientistなど、ツールで強化されたLLMベースのエージェントがいくつか提案されている。しかし、それらの評価範囲は狭く、様々な化学タスクにおけるツールの利点を理解するための大きなギャップを残している。このギャップを埋めるために,ChemCrow上での化学剤の強化であるChemAgentを開発し,その性能を専門的な化学タスクと一般的な化学問題の両方で包括的に評価する。驚いたことに、ChemAgentはツールなしでも、ベースLLMを一貫して上回っているわけではない。化学の専門家によるエラー分析は、合成予測のような特殊な化学タスクでは、特殊ツールでエージェントを増強すべきであるが、試験中のエージェントのような一般的な化学問題では、エージェントが化学知識で正しく推論する能力がより重要であり、ツールの強化が必ずしも役に立たない。

関連論文リスト

ChemAgent: Self-updating Library in Large Language Models Improves Chemical Reasoning [64.2106664137118]
ChemAgentは,大規模言語モデル(LLM)の性能向上を目的とした,新しいフレームワークである。化学タスクをサブタスクに分解し、これらのサブタスクを将来のクエリに参照可能な構造化されたコレクションにコンパイルすることで開発される。新しい問題を提示すると、ChemAgentは、私たちがメモリと呼ぶライブラリから関連する情報を検索し、精査する。
論文参考訳（メタデータ） (2025-01-11T17:10:30Z)
ChemEval: A Comprehensive Multi-Level Chemical Evaluation for Large Language Models [62.37850540570268]
この領域の既存のベンチマークは、化学研究専門家の特定の要求を適切に満たさない。 ChemEvalは化学の4つの重要な進歩レベルを特定し、42の異なる化学タスクで12次元のLCMを評価する。その結果, LLMは文献の理解と指導に優れる一方で, 高度な化学知識を必要とするタスクでは不足していることがわかった。
論文参考訳（メタデータ） (2024-09-21T02:50:43Z)
ChemVLM: Exploring the Power of Multimodal Large Language Models in Chemistry Area [50.15254966969718]
textbfChemVLMは、化学応用のためのオープンソースの化学マルチモーダル大規模言語モデルである。 ChemVLMは、テキストと視覚の化学情報の両方を理解する能力を高めるために、慎重にキュレートされたバイリンガルデータセットで訓練されている。我々はChemVLMを、様々なタスクにおいて、オープンソースおよびプロプライエタリな多モーダルな大規模言語モデルに対してベンチマークする。
論文参考訳（メタデータ） (2024-08-14T01:16:40Z)
A Review of Large Language Models and Autonomous Agents in Chemistry [0.7184549921674758]
大規模言語モデル(LLM)は化学において強力なツールとして登場した。このレビューでは、化学におけるLCMの機能と、自動化による科学的発見を加速する可能性を強調している。エージェントは新たなトピックであるので、化学以外のエージェントのレビューの範囲を広げます。
論文参考訳（メタデータ） (2024-06-26T17:33:21Z)
Are large language models superhuman chemists? [4.87961182129702]
大規模言語モデル(LLM)は、人間の言語を処理し、明示的に訓練されていないタスクを実行する能力によって、広く関心を集めている。本稿では,最新のLCMの化学知識と推論能力を評価する自動化フレームワークであるChemBenchを紹介する。我々は2700以上の質問応答ペアをキュレートし、主要なオープンソースとクローズドソースのLCMを評価し、最良のモデルが最高の化学者より優れていることを発見した。
論文参考訳（メタデータ） (2024-04-01T20:56:25Z)
An Autonomous Large Language Model Agent for Chemical Literature Data Mining [60.85177362167166]
本稿では,幅広い化学文献から高忠実度抽出が可能なエンドツーエンドAIエージェントフレームワークを提案する。本フレームワークの有効性は,反応条件データの精度,リコール,F1スコアを用いて評価する。
論文参考訳（メタデータ） (2024-02-20T13:21:46Z)
ChemLLM: A Chemical Large Language Model [49.308528569982805]
大規模言語モデル(LLM)は化学応用において顕著な進歩を遂げた。しかし、コミュニティには化学に特化したLLMが欠落している。本稿では,化学に特化した最初のLLMを特徴とする包括的フレームワークであるChemLLMを紹介する。
論文参考訳（メタデータ） (2024-02-10T01:11:59Z)
ChemDFM: A Large Language Foundation Model for Chemistry [27.864255196445324]
より汎用的で効率的なソリューションは、多くのタスクに対処し、幅広い化学分野における自由形式の対話をサポートするAIモデルである。我々は化学文献や教科書から34Bトークンを学習し、2.7Mインストラクションを用いて微調整した化学用LLMのパイオニアであるChemDFMを開発した。我々はHuggingface上のChemDFMの推論コード、評価データセット、モデルウェイトをオープンソース化した。
論文参考訳（メタデータ） (2024-01-26T12:45:55Z)
Structured Chemistry Reasoning with Large Language Models [70.13959639460015]
大規模言語モデル(LLMs)は様々な分野において優れているが、特に化学において複雑な科学的推論に苦慮している。所望のガイダンスを提供し,LSMの化学的推論能力を大幅に向上させる,シンプルで効果的なプロンプト戦略であるStructChemを紹介した。量子化学、力学、物理化学、運動学の4分野にわたる試験では、StructChemはGPT-4の性能を大幅に向上させ、最大30%のピーク改善を実現している。
論文参考訳（メタデータ） (2023-11-16T08:20:36Z)
Chemist-X: Large Language Model-empowered Agent for Reaction Condition Recommendation in Chemical Synthesis [57.70772230913099]
Chemist-Xは、検索増強生成(RAG)技術を用いた化学合成において、反応条件レコメンデーション(RCR)タスクを自動化する。 Chemist-Xはオンラインの分子データベースを尋問し、最新の文献データベースから重要なデータを蒸留する。 Chemist-Xは化学者の作業量を大幅に減らし、より根本的で創造的な問題に集中できるようにする。
論文参考訳（メタデータ） (2023-11-16T01:21:33Z)
ChemCrow: Augmenting large-language models with chemistry tools [0.9195187117013247]
大規模言語モデル(LLM)は、領域全体にわたるタスクにおいて高いパフォーマンスを示してきたが、化学に関連した問題に悩まされている。本研究では, 有機合成, 創薬, 材料設計における課題を遂行するLLM化学剤であるChemCrowを紹介する。我々のエージェントは、昆虫の忌避剤である3種の有機触媒の合成を自律的に計画し、実行し、新しいクロモフォアの発見を導いた。
論文参考訳（メタデータ） (2023-04-11T17:41:13Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。