論文の概要: ToolSelf: Unifying Task Execution and Self-Reconfiguration via Tool-Driven Intrinsic Adaptation
- arxiv url: http://arxiv.org/abs/2602.07883v1
- Date: Sun, 08 Feb 2026 09:27:18 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-10 20:26:24.847388
- Title: ToolSelf: Unifying Task Execution and Self-Reconfiguration via Tool-Driven Intrinsic Adaptation
- Title(参考訳): ToolSelf: ツール駆動固有の適応によるタスク実行と自己再構成の統合
- Authors: Jingqi Zhou, Sheng Wang, DeZhao Deng, Junwen Lu, Junwei Su, Qintong Li, Jiahui Gao, Hao Wu, Jiyue Jiang, Lingpeng Kong, Chuan Wu,
- Abstract要約: LLM(Large Language Models)を利用したエージェントシステムは、複雑で長期のタスクに対処する上で、顕著な可能性を示している。
既存のアプローチでは、手動のオーケストレーションやランタイムベースのパッチを頼りにしており、一般化の貧弱さと最適化の断片化に悩まされることが多い。
ツール駆動の自己修正を可能にする新しいパラダイムであるToolSelfを提案する。
- 参考スコア(独自算出の注目度): 60.25542764389203
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Agentic systems powered by Large Language Models (LLMs) have demonstrated remarkable potential in tackling complex, long-horizon tasks. However, their efficacy is fundamentally constrained by static configurations governing agent behaviors, which are fixed prior to execution and fail to adapt to evolving task dynamics. Existing approaches, relying on manual orchestration or heuristic-based patches, often struggle with poor generalization and fragmented optimization. To transcend these limitations, we propose ToolSelf, a novel paradigm enabling tool-driven runtime self-reconfiguration. By abstracting configuration updates as a callable tool, ToolSelf unifies task execution and self-adjustment into a single action space, achieving a phase transition from external rules to intrinsic parameters. Agents can thereby autonomously update their sub-goals and context based on task progression, and correspondingly adapt their strategy and toolbox, transforming from passive executors into dual managers of both task and self. We further devise Configuration-Aware Two-stage Training (CAT), combining rejection sampling fine-tuning with trajectory-level reinforcement learning to internalize this meta-capability. Extensive experiments across diverse benchmarks demonstrate that ToolSelf rivals specialized workflows while generalizing to novel tasks, achieving a 24.1% average performance gain and illuminating a path toward truly self-adaptive agents.
- Abstract(参考訳): LLM(Large Language Models)を利用したエージェントシステムは、複雑で長期のタスクに対処する上で、顕著な可能性を示している。
しかし、それらの効果は、実行前に固定され、進化するタスクのダイナミクスに適応できないエージェントの動作を管理する静的な設定によって、基本的に制限されている。
手動のオーケストレーションやヒューリスティックベースのパッチを頼りにしている既存のアプローチは、一般化の貧弱さと最適化の断片化に悩まされることが多い。
これらの制限を超越するために、ツール駆動ランタイムの自己再構成を可能にする新しいパラダイムであるToolSelfを提案する。
コンフィギュレーションの更新を呼び出し可能なツールとして抽象化することで、ToolSelfはタスクの実行と自己調整を単一のアクション空間に統合し、外部ルールから固有のパラメータへのフェーズ移行を実現する。
これにより、エージェントはタスク進行に基づいてサブゴールとコンテキストを自律的に更新し、それに対応する戦略とツールボックスを適応させ、受動的実行者からタスクと自己の二重マネージャへと変換することができる。
さらに、リジェクションサンプリングの微調整とトラジェクトリレベルの強化学習を組み合わせて、このメタ能力の内部化を図りながら、構成対応2段階訓練(CAT)を考案する。
さまざまなベンチマークにわたる大規模な実験により、ToolSelfは特別なワークフローと競合し、新しいタスクを一般化し、平均的なパフォーマンス向上を24.1%達成し、真に自己適応的なエージェントへの道のりを示した。
関連論文リスト
- PerfGuard: A Performance-Aware Agent for Visual Content Generation [53.591105729011595]
PerfGuardは、ビジュアルコンテンツ生成のためのパフォーマンス対応のエージェントフレームワークである。
ツールのパフォーマンス境界をタスク計画とスケジューリングに統合する。
ツール選択の正確性、実行の信頼性、ユーザの意図との整合性にメリットがあります。
論文 参考訳(メタデータ) (2026-01-30T05:12:19Z) - NaviAgent: Bilevel Planning on Tool Navigation Graph for Large-Scale Orchestration [13.925896302382043]
大規模言語モデル(LLM)は、最近、外部ツールを呼び出すことによって関数呼び出しエージェントとして機能する機能を示した。
そこで我々は,タスクプランニングをツール実行からツールエコシステムのグラフベースモデリングを通じて分離するNaviAgentを提案する。
実験によると、NaviAgentはモデルとタスク間で最高のタスク成功率を達成し、TWMNを統合することで、複雑なタスクで最大17ポイントパフォーマンスが向上する。
論文 参考訳(メタデータ) (2025-06-24T10:39:07Z) - Autonomous Deep Agent [0.7489814067742621]
Deep Agentは、複雑なマルチフェーズタスクを管理するために設計された高度な自律AIシステムである。
システムの基盤は階層型タスクDAGフレームワーク上に構築されています。
Deep Agentは、自己管理型AIシステムにおいて、新しいパラダイムを確立する。
論文 参考訳(メタデータ) (2025-02-10T21:46:54Z) - Gödel Agent: A Self-Referential Agent Framework for Recursive Self-Improvement [112.04307762405669]
G"odel AgentはG"odelマシンにインスパイアされた自己進化型フレームワークである。
G"odel Agentは、パフォーマンス、効率、一般化性において手作業によるエージェントを上回る、継続的な自己改善を実現することができる。
論文 参考訳(メタデータ) (2024-10-06T10:49:40Z) - Learning to Use Tools via Cooperative and Interactive Agents [58.77710337157665]
ツール学習は、外部ツールを使用してユーティリティを拡張するエージェントとして、大きな言語モデル(LLM)を促進する。
ツール選択,ツール実行,アクションキャリブレーションの3つの特別なエージェントを個別にコーディネートする,協調型対話型エージェントフレームワークであるConAgentsを提案する。
3つのデータセットに対する実験により、LLMは、ConAgentsを装備した場合、大幅に改善されたベースラインよりも優れた性能を示した。
論文 参考訳(メタデータ) (2024-03-05T15:08:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。