論文の概要: E2E-REME: Towards End-to-End Microservices Auto-Remediation via Experience-Simulation Reinforcement Fine-Tuning
- arxiv url: http://arxiv.org/abs/2604.11094v1
- Date: Mon, 13 Apr 2026 07:12:04 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-14 20:13:16.386863
- Title: E2E-REME: Towards End-to-End Microservices Auto-Remediation via Experience-Simulation Reinforcement Fine-Tuning
- Title(参考訳): E2E-REME: エクスペリエンスのシミュレーション強化によるエンドツーエンドのマイクロサービス自動修正を目指す
- Authors: Lingzhe Zhang, Yunpeng Zhai, Tong Jia, Minghua He, Chiming Duan, Zhaoyang Liu, Bolin Ding, Ying Li,
- Abstract要約: textitEnd-to-End Microservice Remediation (E2E-MR)を紹介する。
E2E-MRは診断報告から実行可能なプレイブックを生成し、障害システムを自律的に復元する。
我々は、経験シミュレーション強化微調整により訓練されたエンドツーエンドの自己修復モデルであるtextitE2E-REMEを提案する。
- 参考スコア(独自算出の注目度): 36.966897385124646
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Contemporary microservice systems continue to grow in scale and complexity, leading to increasingly frequent and costly failures. While recent LLM-based auto-remediation approaches have emerged, they primarily translate textual instructions into executable Ansible playbooks and rely on expert-crafted prompts, lacking runtime knowledge guidance and depending on large-scale general-purpose LLMs, which limits their accuracy and efficiency. We introduce \textit{End-to-End Microservice Remediation} (E2E-MR), a new task that requires directly generating executable playbooks from diagnosis reports to autonomously restore faulty systems. To enable rigorous evaluation, we build \textit{MicroRemed}, a benchmark that automates microservice deployment, failure injection, playbook execution, and post-repair verification. We further propose \textit{E2E-REME}, an end-to-end auto-remediation model trained via experience-simulation reinforcement fine-tuning. Experiments on public and industrial microservice platforms, compared with nine representative LLMs, show that E2E-REME achieves superior accuracy and efficiency.
- Abstract(参考訳): 現代のマイクロサービスシステムは、規模と複雑さが拡大し続けており、頻繁でコストのかかる障害が発生しています。
最近のLLMベースの自己修復アプローチが出現しているが、主にテキストによる命令を実行可能なAnsibleプレイブックに翻訳し、専門家によるプロンプトに依存し、実行時の知識指導が欠如し、大規模な汎用LLMに依存し、精度と効率を制限している。
本稿では,診断報告から実行可能なプレイブックを直接生成し,障害システムを自律的に復元する新しいタスクである,‘textit{End-to-End Microservice Remediation}’(E2E-MR)を紹介する。
厳格な評価を可能にするために、マイクロサービスデプロイメント、障害注入、プレイブックの実行、再テスト後の検証を自動化するベンチマークである‘textit{MicroRemed}’を構築しました。
さらに、経験シミュレーション強化微調整により訓練されたエンドツーエンドの自己修復モデルである「textit{E2E-REME}」を提案する。
公共および産業用マイクロサービスプラットフォームにおける実験は、9つの代表的なLCMと比較して、E2E-REMEがより優れた精度と効率を達成することを示す。
関連論文リスト
- MicroRemed: Benchmarking LLMs in Microservices Remediation [38.338663893180446]
エージェントベースの推論フレームワークと統合された大規模言語モデル(LLM)は、最近、自律的な意思決定の強い可能性を示している。
期待されているが、未調査の方向性のひとつが、障害のあるマイクロサービスシステムを自動的にリカバリするという、マイクロサービスの修復だ。
既存のアプローチはまだ、SRE(Site Reliability Engineers)からの人為的なプロンプトに依存しています。
エンドツーエンドのマイクロサービス修復において,LSMを評価する最初のベンチマークであるMicroRemedを紹介した。
論文 参考訳(メタデータ) (2025-11-03T02:35:55Z) - InternBootcamp Technical Report: Boosting LLM Reasoning with Verifiable Task Scaling [71.37579508777843]
大規模言語モデル(LLM)は、複雑な推論機能を実現することによって、人工知能に革命をもたらした。
このギャップに対処するため、1000以上のドメイン分散タスク環境からなるオープンソースのフレームワークであるInternBootcampを紹介します。
論文 参考訳(メタデータ) (2025-08-12T05:00:00Z) - AutoEDA: Enabling EDA Flow Automation through Microservice-Based LLM Agents [15.41283323575065]
AutoEDAは、標準化されたスケーラブルな自然言語エクスペリエンスに特化したモデルコンテキストプロトコル(MCP)を通じて並列学習を活用する、EDA自動化のためのフレームワークである。
実験の結果、既存の手法と比較して、自動化の精度と効率が向上し、スクリプトの品質も向上した。
論文 参考訳(メタデータ) (2025-08-01T18:23:57Z) - MAS-ZERO: Designing Multi-Agent Systems with Zero Supervision [76.42361936804313]
自動MAS設計のための自己進化型推論時間フレームワークMAS-ZEROを紹介する。
MAS-ZEROはメタレベルの設計を採用し、各問題インスタンスに適したMAS構成を反復的に生成し、評価し、洗練する。
論文 参考訳(メタデータ) (2025-05-21T00:56:09Z) - MLE-Dojo: Interactive Environments for Empowering LLM Agents in Machine Learning Engineering [57.156093929365255]
自律型大規模言語モデル(LLM)エージェントを体系的に強化し、評価し、改善するためのガイムスタイルのフレームワーク。
MLE-Dojoは、現実的なエンジニアリングシナリオを反映した、多様でオープンなMLEタスクを慎重にキュレートする。
完全に実行可能な環境は、教師付き微調整と強化学習の両方を通して包括的なエージェントトレーニングをサポートする。
論文 参考訳(メタデータ) (2025-05-12T17:35:43Z) - AutoPT: How Far Are We from the End2End Automated Web Penetration Testing? [54.65079443902714]
LLMによって駆動されるPSMの原理に基づく自動浸透試験エージェントであるAutoPTを紹介する。
以上の結果から, AutoPT は GPT-4o ミニモデル上でのベースラインフレームワーク ReAct よりも優れていた。
論文 参考訳(メタデータ) (2024-11-02T13:24:30Z) - RePair: Automated Program Repair with Process-based Feedback [28.017321930042694]
本稿では,プロセスの監督とフィードバックによって,小規模言語モデル(LM)が優れたパフォーマンスを実現する方法を示す。
我々は、批評家として機能する報酬モデルを開発し、微調整されたLMの行動に対するフィードバックを提供する。
その結果, プロセスベースでは, より大きな結果に基づく生成方法よりも, クローズドソースの大規模LMの性能にほぼ匹敵する結果が得られた。
論文 参考訳(メタデータ) (2024-08-21T02:53:23Z) - MicroRes: Versatile Resilience Profiling in Microservices via Degradation Dissemination Indexing [29.456286275972474]
マイクロサービスのレジリエンス — 障害から回復し、信頼性と応答性を備えたサービスを提供し続ける能力 — は、クラウドベンダにとって極めて重要です。
現在のプラクティスは、特定のマイクロサービスシステムに手動で設定された特定のルールに依存しており、結果として労働強度と柔軟性の問題が発生します。
私たちの洞察では、レジリエントなデプロイメントは、システムパフォーマンスからユーザ対応メトリクスへの劣化の拡散を効果的に防ぎ、後者はサービス品質に影響を与えます。
論文 参考訳(メタデータ) (2022-12-25T03:56:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。