Fugu-MT 論文翻訳(概要): Tulip Agent -- Enabling LLM-Based Agents to Solve Tasks Using Large Tool Libraries

論文の概要: Tulip Agent -- Enabling LLM-Based Agents to Solve Tasks Using Large Tool Libraries

arxiv url: http://arxiv.org/abs/2407.21778v1
Date: Wed, 31 Jul 2024 17:50:54 GMT
ステータス: 翻訳完了
システム内更新日: 2024-08-01 17:31:11.880490
Title: Tulip Agent -- Enabling LLM-Based Agents to Solve Tasks Using Large Tool Libraries
Title（参考訳）: チューリップエージェント -- LLMベースのエージェントを駆使して大きなツールライブラリーを用いたタスクを解決
Authors: Felix Ocker, Daniel Tanneberg, Julian Eggert, Michael Gienger,
Abstract要約: tulip Agentは、Create、Read、Update、Deleteといった自律型ロボットエージェントのためのアーキテクチャで、潜在的に多くのツールを含むツールライブラリにアクセスする。最先端の実装とは対照的に、チューリップエージェントはシステムプロンプトで利用可能なすべてのツールの記述をエンコードしない。チューリップエージェントアーキテクチャは推論コストを大幅に削減し、大きなツールライブラリの使用を可能にし、エージェントがそのツールセットを適応し拡張することを可能にする。
参考スコア（独自算出の注目度）: 5.828355593978994
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: We introduce tulip agent, an architecture for autonomous LLM-based agents with Create, Read, Update, and Delete access to a tool library containing a potentially large number of tools. In contrast to state-of-the-art implementations, tulip agent does not encode the descriptions of all available tools in the system prompt, which counts against the model's context window, or embed the entire prompt for retrieving suitable tools. Instead, the tulip agent can recursively search for suitable tools in its extensible tool library, implemented exemplarily as a vector store. The tulip agent architecture significantly reduces inference costs, allows using even large tool libraries, and enables the agent to adapt and extend its set of tools. We evaluate the architecture with several ablation studies in a mathematics context and demonstrate its generalizability with an application to robotics. A reference implementation and the benchmark are available at github.com/HRI-EU/tulip_agent.
Abstract（参考訳）: 我々は、Create、Read、Update、Deleteといった自動LLMエージェントのためのアーキテクチャであるTulip Agentを紹介した。最先端の実装とは対照的に、チューリップエージェントはシステムプロンプトで利用可能なすべてのツールの記述をエンコードしていない。代わりに、チューリップエージェントは、ベクトルストアとして例示的に実装された拡張可能なツールライブラリで、適切なツールを再帰的に検索することができる。チューリップエージェントアーキテクチャは推論コストを大幅に削減し、大きなツールライブラリの使用を可能にし、エージェントがそのツールセットを適応し拡張することを可能にする。数学の文脈でいくつかのアブレーション研究を行い,その一般化可能性とロボット工学への応用を実証した。リファレンス実装とベンチマークはgithub.com/HRI-EU/tulip_agentで公開されている。

関連論文リスト

ReDel: A Toolkit for LLM-Powered Recursive Multi-Agent Systems [39.85101344037394]
ReDelはマルチエージェントシステムを構築するためのツールキットである。カスタムツールの使用、デリゲートスキーム、イベントベースのロギング、インタラクティブなリプレイをサポートする。私たちのコード、ドキュメンテーション、およびPyPIパッケージはオープンソースで、MITライセンス下で自由に使用できます。
論文参考訳（メタデータ） (2024-08-05T05:43:23Z)
Re-Invoke: Tool Invocation Rewriting for Zero-Shot Tool Retrieval [47.81307125613145]
Re-Invokeは、トレーニングなしで大規模ツールセットに効果的にスケールするために設計された教師なしツール検索手法である。我々は、クエリ毎に最も関連性の高いツールを特定するために、意図に基づいて、新しいマルチビュー類似度ランキング戦略を採用する。評価の結果、Re-Invokeはシングルツールとマルチツールの両方のシナリオにおいて、最先端の代替よりも大幅に優れていた。
論文参考訳（メタデータ） (2024-08-03T22:49:27Z)
GTA: A Benchmark for General Tool Agents [32.443456248222695]
229個の実世界のタスクと実行可能なツールチェーンを設計し、主要な大言語モデル(LLM)を評価する。 GPT-4 はタスクの 50% 以下であり,ほとんどの LLM は 25% 以下である。この評価は、現実シナリオにおける現在のLLMのツール利用能力のボトルネックを明らかにし、汎用ツールエージェントを前進させるための今後の方向性を提供する。
論文参考訳（メタデータ） (2024-07-11T17:50:09Z)
Chain of Tools: Large Language Model is an Automatic Multi-tool Learner [54.992464510992605]
Automatic Tool Chain(ATC)は、大規模言語モデル(LLM)がマルチツールユーザとして機能することを可能にするフレームワークである。次に,ツールの範囲を拡大するために,ブラックボックス探索法を提案する。包括的な評価のために、ToolFlowという挑戦的なベンチマークを構築しました。
論文参考訳（メタデータ） (2024-05-26T11:40:58Z)
EASYTOOL: Enhancing LLM-based Agents with Concise Tool Instruction [56.02100384015907]
EasyToolは、多種多様で長いツールドキュメントを統一的で簡潔なツール命令に変換するフレームワークである。トークン使用量を大幅に削減し、現実のシナリオにおけるツール利用のパフォーマンスを向上させることができる。
論文参考訳（メタデータ） (2024-01-11T15:45:11Z)
GitAgent: Facilitating Autonomous Agent with GitHub by Tool Extension [81.44231422624055]
さまざまなタスクを実行できる外部ツールを備えた大規模言語モデル(LLM)に焦点が当てられている。本稿では,GitHubから自動ツール拡張を実現するエージェントであるGitAgentを紹介する。
論文参考訳（メタデータ） (2023-12-28T15:47:30Z)
MetaTool Benchmark for Large Language Models: Deciding Whether to Use Tools and Which to Use [79.87054552116443]
大規模言語モデル(LLM)は、その印象的な自然言語処理(NLP)能力のために大きな注目を集めている。このベンチマークは、LLMがツールの使用意識を持ち、ツールを正しく選択できるかどうかを評価するためのものだ。 8つの人気のあるLCMを巻き込んだ実験を行い、その大半は依然として効果的にツールを選択するのに苦労していることがわかった。
論文参考訳（メタデータ） (2023-10-04T19:39:26Z)
Agents: An Open-source Framework for Autonomous Language Agents [98.91085725608917]
我々は、言語エージェントを人工知能への有望な方向と見なしている。 Agentsはオープンソースライブラリで、これらの進歩を広く非専門的な聴衆に開放することを目的としています。
論文参考訳（メタデータ） (2023-09-14T17:18:25Z)
ToolLLM: Facilitating Large Language Models to Master 16000+ Real-world APIs [104.37772295581088]
オープンソースの大規模言語モデル(LLM)、例えばLLaMAは、ツール使用能力に大きく制限されている。データ構築、モデルトレーニング、評価を含む汎用ツールであるToolLLMを紹介する。ツール使用のためのインストラクションチューニングフレームワークであるToolBenchを,ChatGPTを使って自動構築する。
論文参考訳（メタデータ） (2023-07-31T15:56:53Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。