論文の概要: SePO: Self-Evolving Prompt Agent for System Prompt Optimization
- arxiv url: http://arxiv.org/abs/2606.04465v1
- Date: Wed, 03 Jun 2026 05:20:30 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-04 20:44:18.564394
- Title: SePO: Self-Evolving Prompt Agent for System Prompt Optimization
- Title(参考訳): SePO: システムプロンプト最適化のための自己進化型プロンプトエージェント
- Authors: Wangcheng Tao, Han Wu, Weng-Fai Wong,
- Abstract要約: システムプロンプト最適化は、基礎となるモデルを変更することなくエージェントの動作を改善する。
本稿では,タスクエージェントのシステムプロンプトと並行して,プロンプトエージェント自身のシステムプロンプトを最適化ターゲットとして扱う自己進化型プロンプト最適化(SePO)を提案する。
SePO は Manual-CoT, TextGrad, MetaSPO を一貫して上回り、 Manual-CoT と比較して平均精度は 4.49 ポイント向上している。
- 参考スコア(独自算出の注目度): 9.6902824113151
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: System prompt optimization improves agent behavior without modifying the underlying model, yielding human-readable, model-agnostic instructions. Existing methods build a prompt agent that refines task agents' system prompts, yet leave the prompt agent's own system prompt hand-engineered and fixed. We propose Self-Evolving Prompt Optimization (SePO), which treats the prompt agent's own system prompt as an optimization target alongside task agents' system prompts. SePO adopts a self-referential design. A single prompt agent improves both task agents' system prompts and its own under an open-ended evolutionary search that maintains an archive of candidate prompts as stepping stones. Training proceeds in two stages: pre-training evolves the prompt agent on a multi-task pool, and fine-tuning then applies it to a target task. Across five benchmarks spanning math (AIME'25), abstract reasoning (ARC-AGI-1), graduate-level science (GPQA), code generation (MBPP), and logic puzzles (Sudoku), SePO consistently outperforms Manual-CoT, TextGrad, and MetaSPO, improving the average accuracy by 4.49 points compared to Manual-CoT. The prompt optimization skill from pre-training also generalizes to tasks beyond the pre-training mixture, rather than memorizing per-task prompts.
- Abstract(参考訳): システムプロンプト最適化は、基礎となるモデルを変更することなくエージェントの動作を改善する。
既存のメソッドは、タスクエージェントのシステムプロンプトを洗練させるプロンプトエージェントを構築するが、プロンプトエージェント自身のシステムが手動で手動操作され、固定される。
本稿では,タスクエージェントのシステムプロンプトと並行して,プロンプトエージェント自身のシステムプロンプトを最適化ターゲットとして扱うセルフ進化型プロンプト最適化(SePO)を提案する。
SePOは自己参照型設計を採用している。
単一のプロンプトエージェントは、候補プロンプトのアーカイブをステップストーンとして維持するオープンな進化探索の下で、タスクエージェントのシステムプロンプトとそれ自身のプロンプトを改善する。
事前訓練はマルチタスクプールのプロンプトエージェントを進化させ、微調整を目標タスクに適用する。
数学(AIME'25)、抽象推論(ARC-AGI-1)、卒業レベルの科学(GPQA)、コード生成(MBPP)、論理パズル(Sudoku)の5つのベンチマークで、SePOはマニュアルCoT、テキストGrad、メタSPOを一貫して上回り、マニュアルCoTと比較して平均精度は4.49ポイント向上した。
事前学習からの迅速な最適化スキルは、タスク毎のプロンプトを記憶するのではなく、事前学習の混合を超えたタスクに一般化する。
関連論文リスト
- From Intent to Execution: Composing Agentic Workflows with Agent Recommendation [1.462945824459286]
本稿では,マルチエージェントシステムの自動作成のためのフレームワークを提案する。
提案するフレームワークは,必要なタスク固有のアプリケーションをオーケストレーションするソフトウェアモジュールとワークフローで構成されている。
論文 参考訳(メタデータ) (2026-05-05T17:08:26Z) - Agent-GWO: Collaborative Agents for Dynamic Prompt Optimization in Large Language Models [69.55139736609367]
Agent-GWOは複雑な推論のための動的プロンプト最適化フレームワークである。
本稿では,Agent-GWOが既存のプロンプト最適化手法よりも精度と安定性を一貫して向上することを示す。
論文 参考訳(メタデータ) (2026-04-14T07:35:37Z) - SCOPE: Prompt Evolution for Enhancing Agent Effectiveness [53.75986399936395]
大規模言語モデル(LLM)エージェントは、大規模で動的なコンテキストを生成する環境にますますデプロイされている。
エージェントはこのコンテキストにアクセスできますが、静的なプロンプトには効果的に管理するメカニズムがありません。
textbfSCOPE (Self-evolving Context Optimization via Prompt Evolution) を導入する。
本稿では,戦術的特異性(即時誤りの解消)と戦略的汎用性(長期原則の進化)のバランスをとるデュアルストリーム機構を提案する。
論文 参考訳(メタデータ) (2025-12-17T12:25:05Z) - ZERA: Zero-init Instruction Evolving Refinement Agent - From Zero Instructions to Structured Prompts via Principle-based Optimization [6.591649491003996]
ZERAはシステムとユーザプロンプトを共同で最適化する新しいフレームワークである。
ZERAは自動的に推定される重み付き8つの一般化可能な基準を用いてプロンプトをスコアし、構造化された批判に基づいてプロンプトを改訂する。
推論,要約,コード生成タスクにまたがる5つの大きな言語モデルと9つの多様なデータセットのZERAを評価する。
論文 参考訳(メタデータ) (2025-09-17T01:47:29Z) - TAPO: Task-Referenced Adaptation for Prompt Optimization [18.533289140594146]
本稿では,3つの鍵モジュールからなるマルチタスク対応プロンプト最適化フレームワークTAPOを紹介する。
まず、タスク固有のプロンプト生成機能を強化するために、タスク対応メトリック選択モジュールを提案する。
次に,複数視点からのプロンプトを共同評価するマルチメトリック評価モジュールを提案する。
第3に、自動プロンプト改善のための進化ベースの最適化フレームワークが導入され、様々なタスクへの適応性が改善されている。
論文 参考訳(メタデータ) (2025-01-12T02:43:59Z) - Gödel Agent: A Self-Referential Agent Framework for Recursive Self-Improvement [112.04307762405669]
G"odel AgentはG"odelマシンにインスパイアされた自己進化型フレームワークである。
G"odel Agentは、パフォーマンス、効率、一般化性において手作業によるエージェントを上回る、継続的な自己改善を実現することができる。
論文 参考訳(メタデータ) (2024-10-06T10:49:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。