論文の概要: EPOCH: An Agentic Protocol for Multi-Round System Optimization
- arxiv url: http://arxiv.org/abs/2603.09049v1
- Date: Tue, 10 Mar 2026 00:41:03 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-11 15:25:23.914698
- Title: EPOCH: An Agentic Protocol for Multi-Round System Optimization
- Title(参考訳): EPOCH:マルチラウンドシステム最適化のためのエージェントプロトコル
- Authors: Zhanlin Liu, Yitao Li, Munirathnam Srikanth,
- Abstract要約: 異種環境におけるマルチラウンドシステム最適化のためのエンジニアリングプロトコルであるEPOCHを紹介する。
EPOCHは最適化をベースライン構築と反復的な自己改善の2つのフェーズにまとめる。
さらに、計画、実装、評価を分離するロール制約されたステージを通じて、各ラウンドを構成します。
- 参考スコア(独自算出の注目度): 0.4269415289712572
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Autonomous agents are increasingly used to improve prompts, code, and machine learning systems through iterative execution and feedback. Yet existing approaches are usually designed as task-specific optimization loops rather than as a unified protocol for establishing baselines and managing tracked multi-round self-improvement. We introduce EPOCH, an engineering protocol for multi-round system optimization in heterogeneous environments. EPOCH organizes optimization into two phases: baseline construction and iterative self-improvement. It further structures each round through role-constrained stages that separate planning, implementation, and evaluation, and standardizes execution through canonical command interfaces and round-level tracking. This design enables coordinated optimization across prompts, model configurations, code, and rule-based components while preserving stability, reproducibility, traceability, and integrity of evaluation. Empirical studies in various tasks illustrate the practicality of EPOCH for production-oriented autonomous improvement workflows.
- Abstract(参考訳): 自律エージェントは、反復的な実行とフィードバックを通じて、プロンプト、コード、マシンラーニングシステムを改善するためにますます使われています。
しかし、既存のアプローチは通常、ベースラインを確立し、追跡された多ラウンドの自己改善を管理するための統一的なプロトコルとしてではなく、タスク固有の最適化ループとして設計されている。
異種環境におけるマルチラウンドシステム最適化のためのエンジニアリングプロトコルであるEPOCHを紹介する。
EPOCHは最適化をベースライン構築と反復的な自己改善の2つのフェーズにまとめる。
さらに、計画、実装、評価を分離するロール制約されたステージを通じて各ラウンドを構造化し、標準的なコマンドインターフェースとラウンドレベルのトラッキングを通じて実行を標準化する。
この設計は、安定性、再現性、トレーサビリティ、評価の完全性を維持しながら、プロンプト、モデル構成、コード、ルールベースのコンポーネントをまたいだ協調最適化を可能にする。
各種タスクにおける実証的研究は、生産指向の自律的改善ワークフローにおけるEPOCHの実用性を示している。
関連論文リスト
- Heuristic Search as Language-Guided Program Optimization [17.390448172399374]
大規模言語モデル(LLM)は最適化(CO)においてAHD(Automated Heuristic Design)を進化させた
LLM駆動型AHDのための構造化フレームワークを提案し、発見プロセスをモジュールステージに明示的に分解する。
当社のフレームワークは4つの現実世界のCOドメインにまたがって検証しています。
論文 参考訳(メタデータ) (2026-02-17T21:45:42Z) - Let It Flow: Agentic Crafting on Rock and Roll, Building the ROME Model within an Open Agentic Learning Ecosystem [90.17610617854247]
本稿では,エージェントモデルの生産パイプラインを最適化する基盤インフラであるエージェント学習エコシステム(ALE)を紹介する。
ALEは、重量最適化のためのトレーニング後のフレームワークであるROLL、軌道生成のためのサンドボックス環境マネージャであるROCK、効率的なコンテキストエンジニアリングのためのエージェントフレームワークであるiFlow CLIの3つのコンポーネントで構成されている。
ROMEはALEが基盤として100万件以上のトラジェクトリをトレーニングしたオープンソースエージェントです。
論文 参考訳(メタデータ) (2025-12-31T14:03:39Z) - SOCRATES: Simulation Optimization with Correlated Replicas and Adaptive Trajectory Evaluations [25.18297372152296]
SOCRATESは、調整されたSOアルゴリズムの設計を自動化する新しい2段階のプロシージャである。
実システムのデジタルレプリカのアンサンブルは、ベースラインSOアルゴリズムのセットを評価するテストベッドとして使用される。
LLMはメタ最適化器として機能し、これらのアルゴリズムのパフォーマンストラジェクトリを分析して、最終的なハイブリッド最適化スケジュールを反復的に修正し構成する。
論文 参考訳(メタデータ) (2025-11-01T19:57:38Z) - A Unified Multi-Task Learning Framework for Generative Auto-Bidding with Validation-Aligned Optimization [51.27959658504722]
マルチタスク学習は、これらのタスクを共有表現を通じて共同でトレーニングするための、原則化されたフレームワークを提供する。
既存のマルチタスク最適化戦略は、主にトレーニングダイナミクスによって導かれ、不安定な入札環境ではよく一般化される。
本稿では,タスク毎のトレーニング勾配と保留有効度勾配のアライメントに基づいてタスク重みを適応的に割り当てる,バリデーション適応型マルチタスク最適化(VAMO)を提案する。
論文 参考訳(メタデータ) (2025-10-09T03:59:51Z) - HEAS: Hierarchical Evolutionary Agent Simulation Framework for Cross-Scale Modeling and Multi-Objective Search [4.807104001943257]
階層シミュレーションエージェント(Hierarchical Simulation Agent, HEAS)は、階層化されたエージェントベースのモデリングを進化的最適化とトーナメント評価で統合するPythonフレームワークである。
HEASは、共有コンテキストを読み書きする決定論的レイヤにスケジュールされた軽量プロセス(ストリーム)の階層としてモデルを表現する。
compact APIとCLIは、シングルオブジェクトとマルチオブジェクトの進化をシミュレートし、最適化し、評価します。
論文 参考訳(メタデータ) (2025-08-21T13:35:46Z) - Optimas: Optimizing Compound AI Systems with Globally Aligned Local Rewards [98.0983122471875]
複合システムの効率的な最適化のための統一的なフレームワークであるOptimasを提案する。
各イテレーションにおいて、Optimasはローカルリワード関数(LRF)を効率よく適用し、各コンポーネントのローカル報酬を最大化しながら、この特性を維持する。
我々は,5つの実世界の化合物システムに対して広範な評価を行い,オプティマスが11.92%の平均的な改善によって強いベースラインを上回っていることを示す。
論文 参考訳(メタデータ) (2025-07-03T07:12:48Z) - PER-DPP Sampling Framework and Its Application in Path Planning [5.158004370485019]
意思決定中心の強化学習フレームワークは、高度な制御システム研究で注目されている。
本研究では,強化学習体験再生機構におけるサンプル問題に対する方法論的改善を提案する。
多様性評価にDPP(Determinant Point Process)を導入することにより、適応的な選択プロトコルを備えた二重基準サンプリングフレームワークを開発する。
論文 参考訳(メタデータ) (2025-03-10T14:58:16Z) - Proximal Policy Optimization-based Transmit Beamforming and Phase-shift
Design in an IRS-aided ISAC System for the THz Band [90.45915557253385]
テラヘルツ(THz)帯で動作するIRS支援統合センシング・通信(ISAC)システムを提案し,システム容量を最大化する。
透過ビームフォーミングと位相シフト設計はエルゴード制約を伴う普遍最適化問題に変換される。
論文 参考訳(メタデータ) (2022-03-21T09:15:18Z) - MLComp: A Methodology for Machine Learning-based Performance Estimation
and Adaptive Selection of Pareto-Optimal Compiler Optimization Sequences [10.200899224740871]
組込みソフトウェア最適化のための新しい強化学習型ポリシー手法を提案する。
異なる機械学習モデルが自動的にテストされ、最適なものを選択する。
また、ターゲットとするプラットフォームやアプリケーションドメインに対して、フレームワークを効率的にトレーニングできることも示しています。
論文 参考訳(メタデータ) (2020-12-09T19:13:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。