論文の概要: El Agente Forjador: Task-Driven Agent Generation for Quantum Simulation
- arxiv url: http://arxiv.org/abs/2604.14609v1
- Date: Thu, 16 Apr 2026 04:28:56 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-17 21:29:31.721492
- Title: El Agente Forjador: Task-Driven Agent Generation for Quantum Simulation
- Title(参考訳): El Agente Forjador: 量子シミュレーションのためのタスク駆動エージェント生成
- Authors: Zijian Zhang, Aiwei Yin, Amaan Baweja, Jiaru Bai, Ignacio Gustin, Varinia Bernales, Alán Aspuru-Guzik,
- Abstract要約: El Agente Forjadorは、ユニバーサルコーディングエージェントが自律的にフォークし、検証し、再利用するマルチエージェントフレームワークである。
ツール生成と再利用のフレームワークがベースラインの精度を継続的に向上することを示す。
- 参考スコア(独自算出の注目度): 7.535793342235731
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: AI for science promises to accelerate the discovery process. The advent of large language models (LLMs) and agentic workflows enables the expediting of a growing range of scientific tasks. However, most of the current generation of agentic systems depend on static, hand-curated toolsets that hinder adaptation to new domains and evolving libraries. We present El Agente Forjador, a multi-agent framework in which universal coding agents autonomously forge, validate, and reuse computational tools through a four-stage workflow of tool analysis, tool generation, task execution, and iterative solution evaluation. Evaluated across 24 tasks spanning quantum chemistry and quantum dynamics on five coding agent setups, we compare three operating modes: zero-shot generation of tools per task, reuse of a curriculum-built toolset, and direct problem-solving with the coding agents as the baseline. We find that our tool generation and reuse framework consistently improves accuracy over the baseline. We also show that reusing a toolset built by a stronger coding agent can reduce API cost and substantially raises the solution quality for weaker coding agents. Case studies further demonstrate that tools forged for different domains can be combined to solve hybrid tasks. Taken together, these results show that LLM-based agents can use their scientific knowledge and coding capabilities to autonomously build reusable scientific tools, pointing toward a paradigm in which agent capabilities are defined by the tasks they are designed to solve rather than by explicitly engineered implementations.
- Abstract(参考訳): 科学のためのAIは発見プロセスを加速することを約束する。
大規模言語モデル(LLM)とエージェントワークフローの出現は、様々な科学的タスクの迅速化を可能にする。
しかし、現在のエージェントシステムのほとんどは、新しいドメインや進化するライブラリへの適応を妨げる静的で手作業によるツールセットに依存している。
ツール分析,ツール生成,タスク実行,反復的ソリューション評価の4段階のワークフローを通じて,ユニバーサルコーディングエージェントが自律的に計算ツールを鍛造,検証,再利用するマルチエージェントフレームワークであるEl Agente Forjadorを提案する。
5つのコーディングエージェントのセットアップで量子化学と量子力学にまたがる24のタスクを評価し、タスク毎のツールのゼロショット生成、カリキュラム構築ツールセットの再利用、コーディングエージェントをベースラインとして直接問題解決という3つの動作モードを比較した。
ツール生成と再利用のフレームワークがベースラインの精度を継続的に改善していることが分かりました。
また、より強力なコーディングエージェントによって構築されたツールセットの再利用は、APIコストを低減し、より弱いコーディングエージェントのソリューション品質を大幅に向上させることを示す。
さらにケーススタディでは、異なるドメインに鍛えられたツールを組み合わせることで、ハイブリッドタスクを解決できることが示されている。
これらの結果は, LLMをベースとしたエージェントが, その科学的知識とコーディング能力を用いて, 再利用可能な科学的ツールを自律的に構築できることを示し, エージェント能力が明示的に設計された実装ではなく, 解決すべきタスクによって定義されるパラダイムを指摘する。
関連論文リスト
- An Agentic Framework for Autonomous Materials Computation [70.24472585135929]
大規模言語モデル(LLM)は、科学的発見を加速するための強力なツールとして登場した。
近年の進歩はLLMをエージェントフレームワークに統合し、複雑な科学実験のための検索、推論、ツールの使用を可能にしている。
本稿では,第一原理計算の信頼性向上を目的としたドメイン特化エージェントを提案する。
論文 参考訳(メタデータ) (2025-12-22T15:03:57Z) - Simple Agents Outperform Experts in Biomedical Imaging Workflow Optimization [69.36509281190662]
生産レベルのコンピュータビジョンツールを科学データセットに適応させることは、重要な"ラストマイル"ボトルネックである。
我々は、AIエージェントを使ってこの手動コーディングを自動化し、最適なエージェント設計のオープンな問題に焦点を当てる。
簡単なエージェントフレームワークが、人間-専門家のソリューションよりも優れた適応コードを生成することを実証する。
論文 参考訳(メタデータ) (2025-12-02T18:42:26Z) - Generalizable End-to-End Tool-Use RL with Synthetic CodeGym [52.31172214690965]
エージェントRLのための多目的ツール環境を多種多様な、検証可能な、制御可能な、多目的ツール環境を合成するフレームワークであるCodeGymを紹介する。
CodeGymは、静的コーディングの問題を対話的な環境に書き換え、原子関数やロジックを呼び出し可能なツールに抽出する。
さまざまなサイズのモデルとCodeGymでトレーニングされたチェーン・オブ・コンフィグレーションは、一貫したアウト・オブ・ディストリビューションの一般化性を示す。
論文 参考訳(メタデータ) (2025-09-22T03:03:56Z) - LLM Agents Making Agent Tools [2.5529148902034637]
ツールの使用は、大規模言語モデル(LLM)を、複雑なマルチステップタスクを実行できる強力なエージェントに変えた。
しかし、これらのツールは人間の開発者によって事前に実装されなければならない。
論文をコードで自律的にLLM互換のツールに変換するエージェントフレームワークであるToolMakerを提案する。
論文 参考訳(メタデータ) (2025-02-17T11:44:11Z) - Learning to Use Tools via Cooperative and Interactive Agents [58.77710337157665]
ツール学習は、外部ツールを使用してユーティリティを拡張するエージェントとして、大きな言語モデル(LLM)を促進する。
ツール選択,ツール実行,アクションキャリブレーションの3つの特別なエージェントを個別にコーディネートする,協調型対話型エージェントフレームワークであるConAgentsを提案する。
3つのデータセットに対する実験により、LLMは、ConAgentsを装備した場合、大幅に改善されたベースラインよりも優れた性能を示した。
論文 参考訳(メタデータ) (2024-03-05T15:08:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。