論文の概要: SciAgent: A Unified Multi-Agent System for Generalistic Scientific Reasoning
- arxiv url: http://arxiv.org/abs/2511.08151v2
- Date: Mon, 17 Nov 2025 14:32:09 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-18 14:36:22.189108
- Title: SciAgent: A Unified Multi-Agent System for Generalistic Scientific Reasoning
- Title(参考訳): SciAgent: 汎用科学推論のための統一マルチエージェントシステム
- Authors: Xuchen Li, Ruitao Wu, Xuanbo Liu, Xukai Wang, Jinbo Hu, Zhixin Bai, Bohan Zeng, Hao Liang, Leheng Chen, Mingrui Chen, Haitian Zhong, Xuanlin Yang, Xu-Yao Zhang, Liu Liu, Jia Li, Kaiqi Huang, Jiahao Xu, Haitao Mi, Wentao Zhang, Bin Dong,
- Abstract要約: SciAgentは、一般的な科学的推論のために設計された統合マルチエージェントシステムである。
コーディネータエージェントは、各問題のドメインと複雑性を解釈し、特別なWorker Systemsを動的にオーケストレーションします。
これらの労働者システムは、記号推論、概念モデリング、数値計算、検証のための相互作用的推論サブエージェントで構成されている。
- 参考スコア(独自算出の注目度): 54.186990494217916
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recent advances in large language models have enabled AI systems to achieve expert-level performance on domain-specific scientific tasks, yet these systems remain narrow and handcrafted. We introduce SciAgent, a unified multi-agent system designed for generalistic scientific reasoning-the ability to adapt reasoning strategies across disciplines and difficulty levels. SciAgent organizes problem solving as a hierarchical process: a Coordinator Agent interprets each problem's domain and complexity, dynamically orchestrating specialized Worker Systems, each composed of interacting reasoning Sub-agents for symbolic deduction, conceptual modeling, numerical computation, and verification. These agents collaboratively assemble and refine reasoning pipelines tailored to each task. Across mathematics and physics Olympiads (IMO, IMC, IPhO, CPhO), SciAgent consistently attains or surpasses human gold-medalist performance, demonstrating both domain generality and reasoning adaptability. Additionally, SciAgent has been tested on the International Chemistry Olympiad (IChO) and selected problems from the Humanity's Last Exam (HLE) benchmark, further confirming the system's ability to generalize across diverse scientific domains. This work establishes SciAgent as a concrete step toward generalistic scientific intelligence-AI systems capable of coherent, cross-disciplinary reasoning at expert levels.
- Abstract(参考訳): 大規模言語モデルの最近の進歩により、AIシステムはドメイン固有の科学的タスクにおいて専門家レベルのパフォーマンスを達成することができたが、これらのシステムは狭く手作りのままである。
SciAgentは、一般的な科学的推論のために設計された統合マルチエージェントシステムであり、規律と難易度にまたがる推論戦略を適応させる能力である。
コーディネーターエージェントは、各問題のドメインと複雑性を解釈し、特殊労働者システムを動的にオーケストレーションし、それぞれが象徴的推論、概念的モデリング、数値計算、検証のための相互作用的推論サブエージェントで構成されている。
これらのエージェントは、各タスクに適した推論パイプラインを協調的に組み立て、精製する。
数学と物理学全体にわたって、オリンピアード(IMO, IMC, IPhO, CPhO)では、SciAgentは一貫して人間のゴールドメダリストのパフォーマンスを達成または超越し、ドメインの一般性と推論の適合性を実証している。
さらに、SciAgentはIChO(International Chemistry Olympiad)でテストされ、HLE(Humanity's Last Exam)ベンチマークから選択された問題により、様々な科学分野にまたがるシステムの一般化能力が確認された。
この研究は、SciAgentを、専門家レベルで一貫性のある学際的推論が可能な汎用的な科学知能-AIシステムへの具体的なステップとして確立する。
関連論文リスト
- MOSAIC: Multi-agent Orchestration for Task-Intelligent Scientific Coding [5.470408942595905]
MOSAICは訓練のないフレームワークで、特別に設計されたエージェントで、生徒-教師のパラダイム内で、自己表現し、合理性を作り、コードを作り、デバッグする。
我々はMOSAICを科学的符号化ベンチマークで評価し、我々の特殊エージェントフレームワークが既存の手法よりも精度、堅牢性、解釈可能性で優れていることを示した。
論文 参考訳(メタデータ) (2025-10-09T20:35:23Z) - InfiAgent: Self-Evolving Pyramid Agent Framework for Infinite Scenarios [28.65914611521654]
InfiAgentはピラミッドのようなDAGベースのMulti-Agent Frameworkで、textbfinfiniteのシナリオに適用できる。
InfiAgentはADAS(類似の自動生成エージェントフレームワーク)と比較して9.9%高いパフォーマンスを実現している
論文 参考訳(メタデータ) (2025-09-26T15:44:09Z) - ScienceBoard: Evaluating Multimodal Autonomous Agents in Realistic Scientific Workflows [82.07367406991678]
大規模言語モデル(LLM)は自然言語処理を超えてその影響を拡大している。
これらのうち、コンピュータ利用エージェントは、人間がしているようにオペレーティングシステムと対話することができる。
我々はScienceBoardを紹介し、ダイナミックで視覚的にリッチな科学ソフトウェアを特徴とする現実的でマルチドメイン環境を包含する。
論文 参考訳(メタデータ) (2025-05-26T12:27:27Z) - Large Language Model Agent: A Survey on Methodology, Applications and Challenges [88.3032929492409]
大きな言語モデル(LLM)エージェントは、目標駆動の振る舞いと動的適応能力を持ち、人工知能への重要な経路を示す可能性がある。
本調査は, LLMエージェントシステムを方法論中心の分類法により体系的に分解する。
私たちの作業は、エージェントの構築方法、コラボレーション方法、時間の経過とともにどのように進化するか、という、統一されたアーキテクチャの視点を提供します。
論文 参考訳(メタデータ) (2025-03-27T12:50:17Z) - The Rise and Potential of Large Language Model Based Agents: A Survey [91.71061158000953]
大規模言語モデル(LLM)は、人工知能(AGI)の潜在的な火花と見なされる
まず、エージェントの概念を哲学的起源からAI開発まで追跡し、LLMがエージェントに適した基盤である理由を説明します。
単一エージェントシナリオ,マルチエージェントシナリオ,ヒューマンエージェント協調の3つの側面において,LLMベースのエージェントの広範な応用について検討する。
論文 参考訳(メタデータ) (2023-09-14T17:12:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。