論文の概要: A Self-Healing Framework for Reliable LLM-Based Autonomous Agents
- arxiv url: http://arxiv.org/abs/2605.06737v1
- Date: Thu, 07 May 2026 13:10:41 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-11 19:43:38.501043
- Title: A Self-Healing Framework for Reliable LLM-Based Autonomous Agents
- Title(参考訳): LLMをベースとした自律エージェントの自己修復フレームワーク
- Authors: Cheonsu Jeong, Younggun Shin,
- Abstract要約: 本稿では,LSMベースのソフトウェアエージェントのための信頼性を考慮した自己修復フレームワークを提案する。
提案フレームワークはマルチエージェントのワークフロー環境に実装され,実世界のタスクシナリオを用いて評価される。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Autonomous agents based on Large Language Models (LLMs) are increasingly being utilized in complex software systems. However, reliability remains a significant challenge due to unpredictable failures such as hallucinations, execution errors, and inconsistent reasoning. This paper proposes a reliability-aware self-healing framework for LLM-based software agents. The framework integrates failure detection, reliability assessment, and automated recovery mechanisms. First, we define a taxonomy of failure types and introduce a quantitative reliability assessment model. Next, we propose a failure detection method that identifies abnormal agent behavior based on execution patterns and output consistency. Finally, we design a self-healing mechanism that dynamically recovers from failures through adaptive replanning and corrective prompting strategies. The proposed framework was implemented in a multi-agent workflow environment and evaluated using real-world task scenarios. Experimental results demonstrate that our approach significantly increases task success rates, reduces failure propagation, and enhances overall system robustness compared to existing methods. In particular, this study distinguishes itself by establishing an integrated monitoring system that combines the agent's internal reasoning process with external execution results. These findings are expected to contribute to securing the stability of advanced autonomous systems and lowering the barriers to LLM adoption in production environments.
- Abstract(参考訳): 大規模言語モデル(LLM)に基づく自律エージェントは、複雑なソフトウェアシステムでますます利用されている。
しかし、幻覚、実行エラー、一貫性のない推論などの予測不可能な失敗のため、信頼性は依然として重大な課題である。
本稿では,LSMベースのソフトウェアエージェントのための信頼性を考慮した自己修復フレームワークを提案する。
このフレームワークは障害検出、信頼性評価、自動リカバリ機構を統合している。
まず,障害型の分類を定義し,定量的信頼性評価モデルを導入する。
次に,実行パターンと出力整合性に基づいて異常エージェントの動作を識別する故障検出手法を提案する。
最後に,適応的再計画と修正促進戦略によって障害から動的に回復する自己修復機構を設計する。
提案フレームワークはマルチエージェントのワークフロー環境に実装され,実世界のタスクシナリオを用いて評価される。
実験結果から,本手法はタスク成功率を大幅に向上し,故障伝播を低減し,既存手法と比較してシステム全体の堅牢性を向上させることが示された。
特に本研究では,エージェントの内部推論プロセスと外部実行結果を組み合わせた統合監視システムを確立することで,自分自身を区別する。
これらの知見は、先進的な自律システムの安定性の確保と、生産環境におけるLLM導入への障壁の低減に寄与することが期待されている。
関連論文リスト
- Automated Self-Testing as a Quality Gate: Evidence-Driven Release Management for LLM Applications [51.56484100374058]
我々は,エビデンスに基づくリリース決定を伴う品質ゲートを導入する自動自己テストフレームワークを提案する。
内部展開型多エージェント対話型AIシステムの縦型ケーススタディにより,本フレームワークの評価を行った。
論文 参考訳(メタデータ) (2026-03-13T20:44:15Z) - AgentFixer: From Failure Detection to Fix Recommendations in LLM Agentic Systems [7.429835301272413]
フレームワークには15の障害検出ツールと2つの根本原因分析モジュールが含まれている。
軽量なルールベースのチェックとLDM-as-a-judgeアセスメントを統合し、構造化インシデント検出、分類、修復をサポートする。
我々は、このフレームワークをIBM CUGAに適用し、AppWorldとWebArenaベンチマークのパフォーマンスを評価した。
論文 参考訳(メタデータ) (2026-02-18T14:55:35Z) - ProbeLLM: Automating Principled Diagnosis of LLM Failures [89.44131968886184]
ProbeLLMはベンチマークに依存しない自動探索フレームワークで、個々の障害から構造的障害モードへの脆弱性発見を増大させる。
ProbeLLMは、検証可能なテストケースにプローブを制限し、ツールの拡張された生成と検証を活用することで、信頼性のある証拠として障害発見を根拠とする。
論文 参考訳(メタデータ) (2026-02-13T14:33:13Z) - Agentic Confidence Calibration [67.50096917021521]
Holistic Trajectory (HTC)はAIエージェントの新しい診断フレームワークである。
HTCはキャリブレーションと差別の両方において、強力なベースラインを一貫して超えている。
HTCは、障害の背後にあるシグナルを明らかにすることによって、解釈可能性を提供する。
論文 参考訳(メタデータ) (2026-01-22T09:08:25Z) - Failure Modes in LLM Systems: A System-Level Taxonomy for Reliable AI Applications [0.0]
大規模言語モデル(LLM)は、意思決定支援ツール、自動化、AI対応ソフトウェアシステムに急速に統合されている。
本稿では,現実のLLMアプリケーションで発生する15の隠れ障害モードのシステムレベルでの分類について述べる。
論文 参考訳(メタデータ) (2025-11-25T05:19:23Z) - Enhancing LLM Reliability via Explicit Knowledge Boundary Modeling [41.19330514054401]
大規模言語モデル(LLM)は、不一致の自己認識に起因する幻覚の傾向にある。
本稿では,高速かつ低速な推論システムを統合し,信頼性とユーザビリティを調和させる明示的知識境界モデリングフレームワークを提案する。
論文 参考訳(メタデータ) (2025-03-04T03:16:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。