論文の概要: Improving Large Language Models Function Calling and Interpretability via Guided-Structured Templates
- arxiv url: http://arxiv.org/abs/2509.18076v1
- Date: Mon, 22 Sep 2025 17:55:14 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-23 18:58:16.551191
- Title: Improving Large Language Models Function Calling and Interpretability via Guided-Structured Templates
- Title(参考訳): ガイド付き構造化テンプレートによる大言語モデルの呼び出しと解釈性の向上
- Authors: Hy Dang, Tianyi Liu, Zhuofeng Wu, Jingfeng Yang, Haoming Jiang, Tao Yang, Pei Chen, Zhengyang Wang, Helen Wang, Huasheng Li, Bing Yin, Meng Jiang,
- Abstract要約: 大規模言語モデル(LLM)は強力な推論とツール使用能力を示している。
LLMは、誤ったパラメータ化、悪いツールの選択、ユーザーの意図の誤解釈によって、現実世界のツールインタラクションで失敗することが多い。
我々は、構造化推論テンプレートを利用して、関数呼び出しを生成するためのより故意なステップバイステップ命令を通してLCMをガイドするカリキュラムに着想を得たフレームワークを提案する。
- 参考スコア(独自算出の注目度): 56.73907811047611
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Large language models (LLMs) have demonstrated strong reasoning and tool-use capabilities, yet they often fail in real-world tool-interactions due to incorrect parameterization, poor tool selection, or misinterpretation of user intent. These issues often stem from an incomplete understanding of user goals and inadequate comprehension of tool documentation. While Chain-of-Thought (CoT) prompting has proven effective for enhancing reasoning in general contexts, our analysis reveals that free-form CoT is insufficient and sometimes counterproductive for structured function-calling tasks. To address this, we introduce a curriculum-inspired framework that leverages structured reasoning templates to guide LLMs through more deliberate step-by-step instructions for generating function callings. Experimental results show that our method reduces tool-use errors, achieving 3-12% relative improvements over strong baselines across diverse model series and approaches. Moreover, our framework enhances the robustness, interpretability, and transparency of tool-using agents, advancing the development of more reliable AI assistants for real-world applications.
- Abstract(参考訳): 大規模言語モデル(LLM)は強力な推論とツール使用能力を示してきたが、誤ったパラメータ化やツール選択の貧弱、ユーザ意図の誤解釈などにより、現実のツールインタラクションでは失敗することが多い。
これらの問題は、ユーザ目標の不完全な理解と、ツールドキュメントの不十分な理解に由来することが多い。
チェーン・オブ・ソート(CoT)のプロンプトは一般的な文脈での推論の促進に有効であることが証明されているが,我々は自由形CoTは不十分であり,時には構造的機能呼び出しタスクでは非生産的であることを明らかにした。
これを解決するために,構造化推論テンプレートを活用して,より意図的なステップバイステップ命令による関数呼び出しを誘導するカリキュラムに着想を得たフレームワークを提案する。
実験結果から,本手法はツール使用誤差を低減し,多種多様なモデル系列およびアプローチの強いベースラインに対して3-12%の相対的な改善が達成された。
さらに、我々のフレームワークは、ツール使用エージェントの堅牢性、解釈可能性、透明性を高め、現実のアプリケーションのためのより信頼性の高いAIアシスタントの開発を推進します。
関連論文リスト
- Understanding Tool-Integrated Reasoning [9.235747697967984]
ツール統合推論がLarge Language Models(LLM)をより有能にする理由を考察する。
LLMはPythonのコードインタープリタのようなツールと統合されているが、なぜこのパラダイムが効果的であるかを説明する原則的な理論が欠落している。
我々は、ツールが経験的かつ実現可能なサポートを厳格に拡張し、純粋テキストモデルの能力天井を壊すことを実証した。
論文 参考訳(メタデータ) (2025-08-26T17:03:46Z) - Feedback-Driven Tool-Use Improvements in Large Language Models via Automated Build Environments [70.42705564227548]
大規模言語モデル(LLM)のための環境自動構築パイプラインを提案する。
これにより、外部ツールに頼ることなく、詳細な測定可能なフィードバックを提供する高品質なトレーニング環境の作成が可能になる。
また、ツール使用の精度とタスク実行の完全性の両方を評価する検証可能な報酬機構も導入する。
論文 参考訳(メタデータ) (2025-08-12T09:45:19Z) - CRITICTOOL: Evaluating Self-Critique Capabilities of Large Language Models in Tool-Calling Error Scenarios [30.20881816731553]
大規模な言語モデルが外部ツールを利用する能力により、ますます多様なタスクに対処できるようになった。
タスクがより複雑で長期的になると、複雑なツール利用プロセスが様々な予期せぬエラーを引き起こす可能性がある。
このようなエラーの特定、診断、回復など、効果的に対処する方法が、ツール学習を進める上で重要な研究方向として現れている。
論文 参考訳(メタデータ) (2025-06-11T17:59:18Z) - Adaptive Tool Use in Large Language Models with Meta-Cognition Trigger [49.81945268343162]
我々は,外部ツール利用のための適応型意思決定戦略であるMeCoを提案する。
MeCoは、表現空間内の高レベル認知信号をキャプチャすることで、メタ認知スコアを定量化する。
MeCoは微調整不要で、最小限のコストがかかる。
論文 参考訳(メタデータ) (2025-02-18T15:45:01Z) - From Exploration to Mastery: Enabling LLMs to Master Tools via Self-Driven Interactions [60.733557487886635]
本稿では,大規模言語モデルと外部ツールとの包括的ギャップを埋めることに焦点を当てる。
動的精錬ツールの文書化を目的とした新しいフレームワーク DRAFT を提案する。
この方法論は、3つの異なる学習フェーズからなる革新的な試行錯誤アプローチに基づいている。
論文 参考訳(メタデータ) (2024-10-10T17:58:44Z) - LLM With Tools: A Survey [0.0]
本稿では,LCMに外部ツールの使用を教える領域における方法論,問題点,展開について述べる。
ユーザ命令を実行可能なプランにマッピングする一連の関数によってガイドされるツール統合のための標準化パラダイムを導入する。
調査の結果,ツール起動タイミング,選択精度,堅牢な推論プロセスの必要性など,さまざまな課題が明らかになった。
論文 参考訳(メタデータ) (2024-09-24T14:08:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。