論文の概要: Pushing the Limits of LLM Tool Calling via Experiential Knowledge Integration and Activation
- arxiv url: http://arxiv.org/abs/2606.10875v1
- Date: Tue, 09 Jun 2026 13:51:32 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-10 15:40:58.530517
- Title: Pushing the Limits of LLM Tool Calling via Experiential Knowledge Integration and Activation
- Title(参考訳): 経験的知識統合と活性化によるLCMツール呼び出しの限界を押し上げる
- Authors: Yupu Hao, Zhuoran Jin, Huanxuan Liao, Kang Liu, Jun Zhao,
- Abstract要約: 大規模言語モデル(LLM)は、自律エージェントとして機能するツールの使用に依存するが、多段階実行では失敗することが多い。
本稿では,知識の獲得,アクティベーション,内部化の段階を網羅し,知識がツール利用のパフォーマンスにどのように影響するかを体系的に検討する。
本稿では,知識拡張ツール実行フレームワークKATEを提案する。知識拡張ツール実行フレームワークは,経験的知識と推論幅の拡大した推論と知識認識学習を統合する。
- 参考スコア(独自算出の注目度): 23.538941671680806
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Large language models (LLMs) rely on tool use to act as autonomous agents, yet often fail in multi-step execution due to insufficient tool-related knowledge and ineffective knowledge activation. Therefore, we present a systematic study on how knowledge influences tool-use performance, covering the stages of knowledge acquisition, activation, and internalization. In the knowledge acquisition stage, we acquire and evaluate various forms of experiential knowledge, and our analysis shows that simple instance-level knowledge can already provide strong and reliable gains, while abstract intent-level knowledge offers limited benefits. At inference time, to activate knowledge, we find that prompting LLM to expand the depth of reasoning yields diminishing returns, whereas expanding the width of reasoning by parallel sampling with aggregation more effectively activates latent experiential knowledge. At training time, for knowledge internalization, post-training with knowledge-augmented data further improves performance, with reinforcement learning outperforming supervised fine-tuning. Based on these insights, we propose the Knowledge-Augmented Tool Execution (KATE), a knowledge-augmented tool execution framework that integrates experiential knowledge with reasoning-width-expanded inference and knowledge-aware training. Experiments on BFCL-V3 and AppWorld demonstrate consistent and substantial improvements over strong baselines across model scales. Our Code is available at https://github.com/hypasd-art/KATE.
- Abstract(参考訳): 大規模言語モデル(LLM)は、自律的なエージェントとして機能するためにツールの使用に依存するが、ツール関連の知識が不足し、知識のアクティベーションが不十分なため、多段階実行では失敗することが多い。
そこで本研究では,知識の獲得,活性化,内部化の段階を網羅し,知識が道具の使用実績にどのように影響するかを体系的に検討する。
知識獲得の段階では,経験的知識の様々な形態を習得し,評価し,分析したところ,単純なインスタンスレベルの知識がより強力で信頼性の高い知識を提供する一方で,抽象的なインテントレベルの知識は限られた利益をもたらすことがわかった。
推論時, 知識を活性化するため, LLMに推論の深さを拡大させると, 推論の幅を増大させる一方, 並列サンプリングによる推論の幅を増大させることにより, 潜時経験知識をより効果的に活性化させることがわかった。
学習時には、知識の内在化のために、知識を増強したデータによる後学習により、さらにパフォーマンスが向上し、強化学習は教師付き微調整よりも優れる。
これらの知見に基づいて、知識拡張ツール実行(KATE)を提案する。知識拡張ツール実行フレームワークは、経験的知識を推論幅の拡大した推論と知識認識のトレーニングと統合する。
BFCL-V3とAppWorldの実験では、モデルスケールにわたる強力なベースラインよりも一貫性があり、実質的な改善が示されている。
私たちのコードはhttps://github.com/hypasd-art/KATE.comで利用可能です。
関連論文リスト
- KA2L: A Knowledge-Aware Active Learning Framework for LLMs [11.702131167960923]
本研究では,大規模言語モデル(LLM)によるドメイン固有知識理解の深度について検討する。
本稿では,無知な質問を潜時空間分析によって構築するための知識認識型アクティブラーニングフレームワークを提案する。
その結果、KA2Lは2つのオープンドメインと1つの垂直ドメインデータセットに対して、アノテーションとコストを50%削減するだけでなく、大幅に削減できることが示唆された。
論文 参考訳(メタデータ) (2026-03-18T10:16:07Z) - Unveiling Knowledge Utilization Mechanisms in LLM-based Retrieval-Augmented Generation [77.10390725623125]
検索強化世代(RAG)は知識範囲の拡大に広く利用されている。
RAGは、オープンドメインの質問応答のような知識集約的なタスクを約束しているので、複雑なタスクやインテリジェントアシスタントへの幅広い応用は、その実用性をさらに進歩させてきた。
本稿では、RAGが内部(パラメトリック)知識と外部(検索)知識を統合する本質的なメカニズムを体系的に検討する。
論文 参考訳(メタデータ) (2025-05-17T13:13:13Z) - Enhancing LLM Knowledge Learning through Generalization [73.16975077770765]
我々は,LLMが様々な言い換えの文脈に与えられた同じ事実的知識トークンを継続的に予測する能力は,質問応答によってその知識を抽出する能力と正の相関性を示す。
そこで本稿では,LLMの知識獲得能力を高めるための2つの戦略を提案する。
論文 参考訳(メタデータ) (2025-03-05T17:56:20Z) - KBAlign: Efficient Self Adaptation on Specific Knowledge Bases [73.34893326181046]
本稿では,効率的なモデル適応によりRAGシステムを強化する自己教師型フレームワークKBAlignを提案する。
私たちのキーとなる洞察は、2つの革新的なメカニズムを通じて、モデルの本質的な能力を知識の整合性に活用することです。
KBAlign は GPT-4 による適応によって得られる性能向上の90%を達成できることを示した。
論文 参考訳(メタデータ) (2024-11-22T08:21:03Z) - KnowTuning: Knowledge-aware Fine-tuning for Large Language Models [83.5849717262019]
本研究では,LLMの微粒で粗粒な知識認識を改善するための知識認識ファインタニング(KnowTuning)手法を提案する。
KnowTuningは、きめ細かい事実評価の下で、より少ない事実エラー率で多くの事実を生成する。
論文 参考訳(メタデータ) (2024-02-17T02:54:32Z) - Beyond Factuality: A Comprehensive Evaluation of Large Language Models
as Knowledge Generators [78.63553017938911]
大規模言語モデル(LLM)は、下流の知識集約タスクのための情報検索技術より優れている。
しかし、コミュニティの懸念は、この無検閲の知識を使用することの事実と潜在的意味について多岐にわたる。
本研究では,6つの重要な視点から生成した知識を評価するために設計されたCONNERを紹介する。
論文 参考訳(メタデータ) (2023-10-11T08:22:37Z) - KnowRU: Knowledge Reusing via Knowledge Distillation in Multi-agent
Reinforcement Learning [16.167201058368303]
深層強化学習(RL)アルゴリズムはマルチエージェント領域において劇的に進歩している。
この問題を解決するには、歴史的経験の効率的な活用が不可欠です。
知識再利用のための「KnowRU」という手法を提案する。
論文 参考訳(メタデータ) (2021-03-27T12:38:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。