論文の概要: ANNEAL: Adapting LLM Agents via Governed Symbolic Patch Learning
- arxiv url: http://arxiv.org/abs/2605.16309v1
- Date: Mon, 04 May 2026 05:24:03 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-25 12:34:33.877627
- Title: ANNEAL: Adapting LLM Agents via Governed Symbolic Patch Learning
- Title(参考訳): AnNEAL:Governed Symbolic Patch LearningによるLLMエージェントの適応
- Authors: Safayat Bin Hakim, Keyan Guo, Wenkai Tan, Alvaro Velasquez, Shouhuai Xu, Houbing Herbert Song,
- Abstract要約: 本稿では,繰り返し発生する障害をプロセス知識グラフのシンボル編集に変換する神経シンボルエージェントであるANNEALを紹介する。
その中核となるメカニズムであるFDKA(Failure-Driven Knowledge Acquisition)は、責任のあるオペレータをローカライズし、制約付きLLM生成を通じて型付きパッチを合成し、提案を検証する。
4つのドメインと27のマルチシードランをまたいだANNEALは、永続的な構造修復を行う唯一の評価システムである。
- 参考スコア(独自算出の注目度): 12.44509691077682
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: LLM-based agents can recover from individual execution errors, yet they repeatedly fail on the same fault when the underlying process knowledge--operator schemas, preconditions, and constraints--remains unrepaired. Existing self-evolving approaches address this gap by updating prompts, memory, or model weights, but none directly repair the symbolic structures that encode how tasks are executed, and few provide the governance guarantees required for safe deployment. We introduce ANNEAL, a neuro-symbolic agent that converts recurring failures into governed symbolic edits of a process knowledge graph without modifying foundation model weights. Its core mechanism, Failure-Driven Knowledge Acquisition (FDKA), localizes the responsible operator, synthesizes a typed patch through constrained LLM generation, and validates the proposal via multi-dimensional scoring, symbolic guardrails, and canary testing before commit. Every accepted edit carries full provenance and deterministic rollback capability. Across four domains and 27 multi-seed runs, ANNEAL is the only evaluated system that commits persistent structural repairs--strong baselines such as ReAct and Reflexion achieve high episodic recovery yet retain 72-100% holdout failure rates on recurring faults, whereas ANNEAL reduces these to 0% in the tested recurring-failure settings. Ablation confirms that removing FDKA eliminates all structural repairs and drops success rate by up to 26.7 percentage points. These results suggest that governed symbolic repair offers a complementary paradigm to weight-level and prompt-level adaptation for persistent fault elimination.
- Abstract(参考訳): LLMベースのエージェントは、個々の実行エラーからリカバリできるが、基盤となるプロセス知識、運用上のスキーマ、前提条件、制約など、同じ障害で繰り返しフェールする。
既存の自己進化的なアプローチは、プロンプト、メモリ、モデルウェイトを更新することでこのギャップに対処するが、タスクの実行方法をコードする象徴的な構造を直接修復することはなく、安全なデプロイメントに必要なガバナンス保証を提供するものもほとんどない。
本稿では、繰り返し発生する障害を基礎モデル重みを変更することなく、プロセス知識グラフの象徴的編集に変換する神経シンボルエージェントであるANNEALを紹介する。
その中核となるメカニズムであるFDKA(Failure-Driven Knowledge Acquisition)は、責任のあるオペレータをローカライズし、制約付きLLM生成を通じて型付きパッチを合成し、コミット前の多次元スコアリング、シンボリックガードレール、カナリアテストを通じて提案を検証する。
承認された編集はすべて、完全な証明と決定論的ロールバック機能を持っている。
4つのドメインと27のマルチシードランにまたがるANNEALは、持続的な構造修復を行う唯一の評価システムであり、ReActやReflexionのような強力なベースラインは、高いエピソジックリカバリを達成するが、繰り返し発生する障害に対して72-100%のホールドアウト障害率を保持する一方、ANNEALは、テストされた繰り返し障害設定において、これらを0%に削減する。
アブレーションは、FDKAの除去がすべての構造的な修復を排除し、成功率を26.7%まで下げることを確認した。
これらの結果から, 支配的シンボル修復は, 持続的断層除去のための重量レベル, 即時レベルの適応に相補的なパラダイムをもたらすことが示唆された。
関連論文リスト
- How Sparsity Allocation Shapes Label-Free Post-Pruning Recoverability [4.9112670395105305]
プレニング後の修復法は部分的に崩壊したスパースモデルを復元できるが、その有効性は上流のプルースアロケーションが残したスパースモデルに依存する。
本稿では, 固定されたアクティベーション統計補修バックエンドにおいて, 空間配置が修復後の回復性にどう影響するかを考察する。
論文 参考訳(メタデータ) (2026-05-21T04:03:24Z) - VerifyMAS: Hypothesis Verification for Failure Attribution in LLM Multi-Agent Systems [79.51005192758262]
大規模言語モデル駆動型マルチエージェントシステムは複雑なタスクで優れている。
しかし、信頼性の低いエージェントは、システムレベルの信頼性にとって重要なボトルネックである。
本稿では,エージェント故障の帰属に関する仮説検証フレームワークを提案する。
論文 参考訳(メタデータ) (2026-05-17T14:09:35Z) - RePO-VLA: Recovery-Driven Policy Optimization for Vision-Language-Action Models [90.39703013636868]
RePO-VLAは、リカバリ駆動のポリシー最適化フレームワークである。
成功、回復、失敗の軌跡に異なる役割を割り当てる。
対人的な成功は、平均で20%から75%、実世界の規模で80%まで上昇する。
論文 参考訳(メタデータ) (2026-05-10T08:24:05Z) - IMPACT-CYCLE: A Contract-Based Multi-Agent System for Claim-Level Supervisory Correction of Long-Video Semantic Memory [73.22944697933603]
既存のパイプラインは不透明でエンドツーエンドの出力を生成し、検査の中間状態は公開しない。
IMPACT-Cycleは,マルチモーダル反復クレームレベルのメンテナンスとして,長時間ビデオ理解を再構築するマルチエージェントシステムである。
論文 参考訳(メタデータ) (2026-04-22T03:03:33Z) - Dynamic analysis enhances issue resolution [53.50448142467294]
DAIRA(Dynamic Analysis-enhanced Issue Resolution Agent)は、エージェントの推論サイクルに動的解析を組み込む自動修復フレームワークである。
テストトレース駆動の方法論によって駆動されるDAIRAは、軽量モニタを使用して重要なランタイムデータを抽出する。
Gemini 3 Flash Previewを使用すると、DAIRAは新たな最先端(SOTA)パフォーマンスを確立し、SWE-bench Verifiedデータセットで79.4%の解像度を達成する。
論文 参考訳(メタデータ) (2026-03-23T14:48:54Z) - RECOVER: Robust Entity Correction via agentic Orchestration of hypothesis Variants for Evidence-based Recovery [8.750432529472802]
ツール使用エージェントとして機能するエージェント修正フレームワークであるRECOVERを紹介する。
複数の仮説をASRの証拠として利用し、関連するエンティティを検索し、制約の下で大言語モデル(LLM)の修正を適用する。
エンティティ・フレーズの単語誤り率(E-WER)を8~46%削減し、リコール率を最大22ポイント向上させる。
論文 参考訳(メタデータ) (2026-03-17T11:48:12Z) - MAS-FIRE: Fault Injection and Reliability Evaluation for LLM-Based Multi-Agent Systems [38.44649280816596]
マルチエージェントシステムの障害注入と信頼性評価のための体系的フレームワークMAS-FIREを提案する。
エージェント内認知障害とエージェント間協調障害を対象とする15種類の障害分類を定義した。
MAS-FIREを3つの代表的なMASアーキテクチャに適用することにより、フォールトトレラントな動作の豊富なセットを明らかにする。
論文 参考訳(メタデータ) (2026-02-23T13:47:43Z) - Metacognitive Self-Correction for Multi-Agent System via Prototype-Guided Next-Execution Reconstruction [58.51530390018909]
大規模言語モデルに基づくマルチエージェントシステムは、協調的な問題解決において優れているが、エラーのカスケードには脆弱である。
我々は,MASにリアルタイム,教師なし,ステップレベルの誤り検出と自己補正を付与するメタ認知フレームワークMASCを提案する。
論文 参考訳(メタデータ) (2025-10-16T05:35:37Z) - Semantics-Aligned, Curriculum-Driven, and Reasoning-Enhanced Vulnerability Repair Framework [15.17681731375364]
SeCuRepairは、セマンティクスに準拠し、カリキュラム駆動で、脆弱性修復のための推論強化フレームワークである。
コアとなるSeCuRepairは、理由と脆弱性の修正方法をモデルに明記する必要がある、合理的に編集されたパラダイムを採用している。
SeCuRepairはまた、従来の教師付き微調整を超えて、セマンティックス対応の強化学習を採用している。
論文 参考訳(メタデータ) (2025-10-01T15:09:27Z) - Recover: A Neuro-Symbolic Framework for Failure Detection and Recovery [2.0554045007430672]
本稿では,オンライン障害識別と回復のためのニューロシンボリック・フレームワークであるRecoverを紹介する。
論理ルールとLLMベースのプランナを統合することで、Recoverはシンボル情報を利用してLLMの回復計画を生成する能力を高める。
論文 参考訳(メタデータ) (2024-03-31T17:54:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。