論文の概要: Agent-GWO: Collaborative Agents for Dynamic Prompt Optimization in Large Language Models
- arxiv url: http://arxiv.org/abs/2604.18612v1
- Date: Tue, 14 Apr 2026 07:35:37 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-22 22:41:49.355788
- Title: Agent-GWO: Collaborative Agents for Dynamic Prompt Optimization in Large Language Models
- Title(参考訳): Agent-GWO:大規模言語モデルにおける動的プロンプト最適化のための協調エージェント
- Authors: Xudong Wang, Chaoning Zhang, Chenghao Li, Shuxu Chen, Qigan Sun, Jiaquan Zhang, Fachrina Dewi Puspitasari, Tae-Ho Kim, Jiwei Wei, Malu Zhang, Guoqing Wang, Yang Yang, Heng Tao Shen,
- Abstract要約: Agent-GWOは複雑な推論のための動的プロンプト最適化フレームワークである。
本稿では,Agent-GWOが既存のプロンプト最適化手法よりも精度と安定性を一貫して向上することを示す。
- 参考スコア(独自算出の注目度): 69.55139736609367
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Large Language Models (LLMs) have demonstrated strong capabilities in complex reasoning tasks, while recent prompting strategies such as Chain-of-Thought (CoT) have further elevated their performance in handling complex logical problems. Despite these advances, high-quality reasoning remains heavily reliant on manual static prompts and is sensitive to decoding configurations and task distributions, leading to performance fluctuations and limited transferability. Existing automatic prompt optimization methods typically adopt single-agent local search, failing to simultaneously optimize prompts and decoding hyperparameters within a unified framework to achieve stable global improvements. To address this limitation, we propose Agent-GWO, a dynamic prompt optimization framework for complex reasoning. Specifically, we unify prompt templates and decoding hyperparameters as inheritable agent configurations. By leveraging the leader-follower mechanism of the Grey Wolf Optimizer (GWO), we automatically select three leader agents ($α$, $β$, and $δ$) to guide the collaborative updates of the remaining agents, enabling iterative convergence toward robust optimal reasoning configurations that can be seamlessly integrated for inference. Extensive experiments on multiple mathematical and hybrid reasoning benchmarks across diverse LLM backbones show that Agent-GWO consistently improves accuracy and stability over existing prompt optimization methods. The code will be released publicly.
- Abstract(参考訳): 大規模言語モデル(LLM)は、複雑な推論タスクにおいて強力な能力を示し、最近のChain-of-Thought(CoT)のようなプロンプト戦略は、複雑な論理問題を扱う際のパフォーマンスをさらに高めている。
これらの進歩にもかかわらず、高品質な推論は手動の静的なプロンプトに大きく依存しており、デコード構成やタスクの分散に敏感であり、パフォーマンスの変動と限られた転送可能性をもたらす。
既存の自動プロンプト最適化手法は、通常は単一エージェントのローカルサーチを採用しており、安定したグローバルな改善を実現するために、統合されたフレームワーク内でプロンプトとハイパーパラメータの復号を同時に最適化することができない。
この制限に対処するため,複雑な推論のための動的プロンプト最適化フレームワークであるAgent-GWOを提案する。
具体的には、プロンプトテンプレートとハイパーパラメータを継承可能なエージェント構成としてデコードする。
Grey Wolf Optimizer(GWO)のリーダ・フォロワー機構を活用することで、3つのリーダエージェント(α$,$β$, $δ$)を自動的に選択し、残りのエージェントの協調的な更新をガイドし、推論にシームレスに統合可能な堅牢な最適推論構成への反復収束を可能にする。
多様なLCMバックボーンにまたがる複数の数学的およびハイブリッド推論ベンチマークの広範な実験により、エージェント-GWOは既存のプロンプト最適化手法よりも精度と安定性を一貫して向上することが示された。
コードは公開されます。
関連論文リスト
- CODMAS: A Dialectic Multi-Agent Collaborative Framework for Structured RTL Optimization [5.592208774984063]
CODMASは、構造化弁証法とドメイン認識コード生成と決定論的評価を組み合わせたフレームワークである。
120のVerilogトリプル(最適化されていない、最適化された、テストベンチ)のベンチマークであるRTLOPTを導入し、パイプライン化とクロックゲーティング変換を行った。
論文 参考訳(メタデータ) (2026-03-17T23:10:07Z) - Learning from Prompt itself: the Hierarchical Attribution Prompt Optimization [13.8868879878572]
構造化最適化アプローチでは、改良されたプロンプトを開発するには、自動または半自動の手順が必要である。
現在のプロンプト最適化手法は、しばしばプロンプトドリフトを誘導し、新しいプロンプトが前の障害を修正するが、以前成功したタスクのパフォーマンスを損なう。
本研究では,(1)学習データにおける誤りパターンをターゲットとした動的帰属機構,(2)機能的プロンプトセグメントを編集するための意味単位最適化,(3)エンドツーエンドのLSMとLM-MLLMの両方をサポートするマルチモーダル・フレンドリなプロンプト・プロンプト・フレームワークを提案する。
論文 参考訳(メタデータ) (2026-01-06T03:34:17Z) - Towards Efficient Agents: A Co-Design of Inference Architecture and System [66.59916327634639]
本稿では,エージェントアクセラレーションのための統合フレームワークであるAgentInferを提案する。
問題をAgentCollab、AgentSched、AgentSAM、AgentCompressの4つの相乗的コンポーネントに分解する。
BrowseComp-zhとDeepDiverベンチマークの実験では、これらの手法の相乗的コラボレーションを通じて、AgentInferは非効率なトークン消費を50%以上削減することを示した。
論文 参考訳(メタデータ) (2025-12-20T12:06:13Z) - syftr: Pareto-Optimal Generative AI [40.80352098169579]
syftrはエージェントと非エージェントのRAG構成の広い領域で効率的な多目的探索を行うフレームワークである。
Syftrは、最も正確な流れの正確さを保ちながら、平均して9倍のコストで流れを見つける。
論文 参考訳(メタデータ) (2025-05-26T17:43:13Z) - ARCS: Agentic Retrieval-Augmented Code Synthesis with Iterative Refinement [1.980982378865332]
ARCSは凍結モデル上で、予算化された合成実行再生ループを介して動作する。
生成前に関連するコードコンテキストを検索し、候補を提案し、テストに対して実行し、実行フィードバックに基づいて修正する。
LANLの科学コーパスでは、ベースラインRAGよりも+0.115改良されている。
論文 参考訳(メタデータ) (2025-04-29T05:15:52Z) - Gödel Agent: A Self-Referential Agent Framework for Recursive Self-Improvement [112.04307762405669]
G"odel AgentはG"odelマシンにインスパイアされた自己進化型フレームワークである。
G"odel Agentは、パフォーマンス、効率、一般化性において手作業によるエージェントを上回る、継続的な自己改善を実現することができる。
論文 参考訳(メタデータ) (2024-10-06T10:49:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。