論文の概要: SAGE: Tool-Augmented LLM Task Solving Strategies in Scalable Multi-Agent Environments
- arxiv url: http://arxiv.org/abs/2601.09750v1
- Date: Mon, 12 Jan 2026 15:49:47 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-16 19:43:18.836455
- Title: SAGE: Tool-Augmented LLM Task Solving Strategies in Scalable Multi-Agent Environments
- Title(参考訳): SAGE: スケーラブルなマルチエージェント環境におけるツール強化LDMタスク解決戦略
- Authors: Robert K. Strehlow, Tobias Küster, Oskar F. Kupke, Brandon Llanque Kurps, Fikret Sivrikaya, Sahin Albayrak,
- Abstract要約: 我々は,ツール発見と実行のためのOPACAフレームワークをベースとした,特殊な対話型AIインターフェースであるSAGEを紹介する。
エージェントの概念を駆使し,様々な複雑さの手法を推し進めるタスク解決戦略を多数実装する。
結果は有望であり、異なるタスク解決戦略の異なる長所と短所を強調している。
- 参考スコア(独自算出の注目度): 2.071720670587172
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Large language models (LLMs) have proven to work well in question-answering scenarios, but real-world applications often require access to tools for live information or actuation. For this, LLMs can be extended with tools, which are often defined in advance, also allowing for some fine-tuning for specific use cases. However, rapidly evolving software landscapes and individual services require the constant development and integration of new tools. Domain- or company-specific tools can greatly elevate the usefulness of an LLM, but such custom tools can be problematic to integrate, or the LLM may fail to reliably understand and use them. For this, we need strategies to define new tools and integrate them into the LLM dynamically, as well as robust and scalable zero-shot prompting methods that can make use of those tools in an efficient manner. In this paper, we present SAGE, a specialized conversational AI interface, based on the OPACA framework for tool discovery and execution. The integration with OPACA makes it easy to add new tools or services for the LLM to use, while SAGE itself presents rich extensibility and modularity. This not only provides the ability to seamlessly switch between different models (e.g. GPT, LLAMA), but also to add and select prompting methods, involving various setups of differently prompted agents for selecting and executing tools and evaluating the results. We implemented a number of task-solving strategies, making use of agentic concepts and prompting methods in various degrees of complexity, and evaluated those against a comprehensive set of benchmark services. The results are promising and highlight the distinct strengths and weaknesses of different task-solving strategies. Both SAGE and the OPACA framework, as well as the different benchmark services and results, are available as Open Source/Open Data on GitHub.
- Abstract(参考訳): 大規模言語モデル(LLM)は、疑問に答えるシナリオではうまく機能することが証明されているが、現実のアプリケーションは、ライブ情報やアクティベーションのためのツールにアクセスする必要があることが多い。
このため、LSMはツールで拡張することができ、しばしば事前に定義され、特定のユースケースの微調整も可能である。
しかし、急速に進化するソフトウェアランドスケープと個々のサービスには、新しいツールの継続的な開発と統合が必要です。
ドメイン固有のツールや企業固有のツールは、LLMの有用性を大幅に高めることができますが、そのようなカスタムツールは統合に問題がある場合もあります。
そのためには、新しいツールを定義してLLMに動的に統合する戦略と、それらのツールを効率的に利用するための堅牢でスケーラブルなゼロショットプロンプト方法が必要です。
本稿では,ツール発見と実行のためのOPACAフレームワークをベースとした,特殊な対話型AIインターフェースであるSAGEを提案する。
OPACAとの統合により、LLMが使用する新しいツールやサービスを容易に追加でき、SAGE自体がリッチな拡張性とモジュール性を示している。
これは、異なるモデル(例えば GPT, LLAMA)をシームレスに切り替えるだけでなく、ツールを選択して実行し、結果を評価するさまざまなプロンプトエージェントのセットアップを含むプロンプトメソッドを追加および選択する機能を提供する。
エージェントの概念を駆使し,様々な複雑さの手法を推し進めるタスク解決戦略を多数実装し,それらを総合的なベンチマークサービスと比較して評価した。
結果は有望であり、異なるタスク解決戦略の異なる長所と短所を強調している。
SAGEとOPACAフレームワーク、および異なるベンチマークサービスと結果の両方が、GitHubのOpen Source/Open Dataとして利用可能である。
関連論文リスト
- Tool Learning in the Wild: Empowering Language Models as Automatic Tool Agents [56.822238860147024]
大規模な言語モデルを外部ツールで拡張することは、彼らのユーティリティを拡張するための有望なアプローチとして現れました。
以前のメソッドは、ツールドキュメントを手動で解析し、コンテキスト内デモを作成し、ツールをLLMがステップバイステップの推論で使用する構造化フォーマットに変換する。
LLMがツール使用ワークフローを自動化できるフレームワークであるAutoToolsを提案する。
論文 参考訳(メタデータ) (2024-05-26T11:40:58Z) - Look Before You Leap: Towards Decision-Aware and Generalizable Tool-Usage for Large Language Models [26.28459880766842]
意思決定・汎用ツール・ユース・フレームワーク(DEER)を提案する。
具体的には、まず、自動生成パイプラインを介して、複数の決定ブランチを持つツール使用サンプルを構築します。
提案するDEERは, 各種データセットのベースラインよりも効果的で, 著しく優れる。
論文 参考訳(メタデータ) (2024-02-26T16:11:03Z) - MetaTool Benchmark for Large Language Models: Deciding Whether to Use Tools and Which to Use [79.87054552116443]
大規模言語モデル(LLM)は、その印象的な自然言語処理(NLP)能力のために大きな注目を集めている。
このベンチマークは、LLMがツールの使用意識を持ち、ツールを正しく選択できるかどうかを評価するためのものだ。
8つの人気のあるLCMを巻き込んだ実験を行い、その大半は依然として効果的にツールを選択するのに苦労していることがわかった。
論文 参考訳(メタデータ) (2023-10-04T19:39:26Z) - CRAFT: Customizing LLMs by Creating and Retrieving from Specialized
Toolsets [75.64181719386497]
大規模言語モデル(LLM)のためのツール作成・検索フレームワークであるCRAFTを提案する。
タスク用に特別にキュレートされたツールセットを作成し、複雑なタスクを解決する能力を高めるためにこれらのセットからツールを取得するコンポーネントをLLMに装備する。
本手法はフレキシブルに設計されており,既製のLCMを細かな調整なしに未確認領域やモダリティに適応するためのプラグアンドプレイ方式を提供する。
論文 参考訳(メタデータ) (2023-09-29T17:40:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。