論文の概要: SLM-Based Agentic AI with P-C-G: Optimized for Korean Tool Use
- arxiv url: http://arxiv.org/abs/2509.19369v1
- Date: Fri, 19 Sep 2025 06:25:23 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-25 20:53:19.519723
- Title: SLM-Based Agentic AI with P-C-G: Optimized for Korean Tool Use
- Title(参考訳): SLM-based Agentic AI with P-C-G:Optimized for Korean Tool Use
- Authors: Changhyun Jeon, Jinhee Park, Jungwoo Choi, Keonwoo Kim, Jisu Kim, Minji Hong,
- Abstract要約: Planner-Caller-Generator (P-C-G) は韓国のツールに最適化されたSLMベースのエージェントアーキテクチャである。
P-C-Gは、プランニング、呼び出し、生成をロールごとに分離する: Plannerは、オンデマンドのリプランニングに制限のある初期バッチプランを生成する; Callerは、共同スキーマと値の検証の後、正規化された呼び出しオブジェクトを返す。
- 参考スコア(独自算出の注目度): 14.541958694805574
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: We propose a small-scale language model (SLM) based agent architecture, Planner-Caller-Generator (P-C-G), optimized for Korean tool use. P-C-G separates planning, calling, and generation by role: the Planner produces an initial batch plan with limited on-demand replanning; the Caller returns a normalized call object after joint schema-value validation; and the Generator integrates tool outputs to produce the final answer. We apply a Korean-first value policy to reduce execution failures caused by frequent Korean-to-English code switching in Korean settings. Evaluation assumes Korean queries and Korean tool/parameter specifications; it covers single-chain, multi-chain, missing-parameters, and missing-functions scenarios, and is conducted via an LLM-as-a-Judge protocol averaged over five runs under a unified I/O interface. Results show that P-C-G delivers competitive tool-use accuracy and end-to-end quality while reducing tokens and maintaining acceptable latency, indicating that role-specialized SLMs are a cost-effective alternative for Korean tool-use agents.
- Abstract(参考訳): 韓国のツール利用に最適化された小型言語モデル(SLM)ベースのエージェントアーキテクチャPlanner-Caller-Generator(P-C-G)を提案する。
P-C-Gは、プランニング、呼び出し、生成をロールごとに分離する:プランナーは、オンデマンドのリプランニングに制限のある初期バッチプランを生成し、Callerは、共同スキーマ値検証後に正規化された呼び出しオブジェクトを返し、Generatorはツール出力を統合して最終回答を生成する。
韓国の環境で頻繁に韓国語と英語のコードを切り替えることによる実行障害を軽減するために、韓国語ファーストの値ポリシーを適用した。
韓国のクエリと韓国のツール/パラメータ仕様を前提としており、シングルチェーン、マルチチェーン、欠落パラメータ、欠落機能シナリオをカバーし、統一I/Oインターフェース下で平均5回以上実行されているLLM-as-a-Judgeプロトコルを介して実行される。
その結果,P-C-Gはトークンの削減と許容レイテンシの維持を図りつつ,競争力のあるツール使用精度とエンドツーエンドの品質を実現していることがわかった。
関連論文リスト
- Multi-module GRPO: Composing Policy Gradients and Prompt Optimization for Language Model Programs [77.22973302887435]
グループ相対政策最適化(GRPO)は、後学習言語モデル(LM)に有効なツールであることが証明されている。
GRPOの単純なマルチモジュールであるmmGRPOを提案する。
自動的なプロンプト最適化によって構成されたmGRPOは,分類,多項目検索,プライバシー保護デリゲートタスクなどを通じて,平均11%の精度向上を実現している。
論文 参考訳(メタデータ) (2025-08-06T17:28:31Z) - HyCodePolicy: Hybrid Language Controllers for Multimodal Monitoring and Decision in Embodied Agents [6.861838493263133]
HyCodePolicyは、エンボディエージェントのための言語ベースの制御フレームワークである。
コード合成、幾何学的接地、知覚的モニタリング、反復的修復をクローズドループプログラミングサイクルに統合する。
その結果,HyCodePolicyはロボット操作ポリシーの堅牢性とサンプル効率を大幅に向上させることがわかった。
論文 参考訳(メタデータ) (2025-08-04T17:18:14Z) - PGPO: Enhancing Agent Reasoning via Pseudocode-style Planning Guided Preference Optimization [58.465778756331574]
本稿では,効果的なエージェント学習のためのPGPOと呼ばれる疑似コード型計画優先最適化手法を提案する。
2つの計画指向の報酬により、PGPOは、高品質なPコードプランを生成するLLMエージェントの能力をさらに強化する。
実験により、PGPOは代表エージェントベンチマークよりも優れた性能を示し、現在のリードベースラインより優れていることが示された。
論文 参考訳(メタデータ) (2025-06-02T09:35:07Z) - AgentCPM-GUI: Building Mobile-Use Agents with Reinforcement Fine-Tuning [82.42421823672954]
AgentCPM-GUIは、堅牢で効率的なオンデバイスGUIインタラクションのために構築されている。
私たちのトレーニングパイプラインには、知覚を高めるためのグラウンドアウェア事前トレーニングが含まれています。
AgentCPM-GUIは5つの公開ベンチマークで最先端のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2025-06-02T07:30:29Z) - Redefining Evaluation Standards: A Unified Framework for Evaluating the Korean Capabilities of Language Models [0.0]
我々は,韓国のアセスメントを統合するオープンソースのレジストリベースのフレームワークであるHRET(Haerae Evaluation Toolkit)を紹介する。
HRETは、主要な韓国のベンチマーク、複数の推論バックエンド、マルチメソッド評価を統合している。
モジュール化されたレジストリ設計により、新しいデータセット、メソッド、バックエンドの迅速な取り込みが可能になる。
論文 参考訳(メタデータ) (2025-03-29T04:17:58Z) - GateLens: A Reasoning-Enhanced LLM Agent for Automotive Software Release Analytics [9.549568621873386]
GateLensは、自動車分野のデータ分析のためのLLMベースのシステムである。
遅くて不透明でメンテナンスにコストがかかる従来のマルチエージェントや計画ベースのシステムとは異なり、GateLensはスピード、透明性、信頼性を強調している。
論文 参考訳(メタデータ) (2025-03-27T17:48:32Z) - Adaptive Tool Use in Large Language Models with Meta-Cognition Trigger [49.81945268343162]
我々は,外部ツール利用のための適応型意思決定戦略であるMeCoを提案する。
MeCoは、表現空間内の高レベル認知信号をキャプチャすることで、メタ認知スコアを定量化する。
MeCoは微調整不要で、最小限のコストがかかる。
論文 参考訳(メタデータ) (2025-02-18T15:45:01Z) - ChatSOP: An SOP-Guided MCTS Planning Framework for Controllable LLM Dialogue Agents [52.7201882529976]
対話エージェントの制御性を高めるため,SOP誘導モンテカルロ木探索(MCTS)計画フレームワークを提案する。
これを実現するために、GPT-4oを用いた半自動ロールプレイシステムを用いて、SOPアノテーション付きマルチシナリオ対話からなるデータセットをキュレートする。
また、SOP予測のための教師付き微調整と思考の連鎖推論を統合する新しい手法を提案する。
論文 参考訳(メタデータ) (2024-07-04T12:23:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。