論文の概要: Conditional Multi-Stage Failure Recovery for Embodied Agents
- arxiv url: http://arxiv.org/abs/2507.06016v1
- Date: Tue, 08 Jul 2025 14:23:41 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-09 16:34:38.159832
- Title: Conditional Multi-Stage Failure Recovery for Embodied Agents
- Title(参考訳): 浸漬剤の条件付き多段故障回復
- Authors: Youmna Farag, Svetlana Stoyanchev, Mohan Li, Simon Keizer, Rama Doddipatla,
- Abstract要約: ゼロショット連鎖プロンプトを用いた条件付き多段階故障復旧フレームワークを提案する。
我々は,TEACHデータセットのTfDベンチマークを用いて評価を行い,最先端の性能を実現する。
- 参考スコア(独自算出の注目度): 17.95974193288372
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Embodied agents performing complex tasks are susceptible to execution failures, motivating the need for effective failure recovery mechanisms. In this work, we introduce a conditional multistage failure recovery framework that employs zero-shot chain prompting. The framework is structured into four error-handling stages, with three operating during task execution and one functioning as a post-execution reflection phase. Our approach utilises the reasoning capabilities of LLMs to analyse execution challenges within their environmental context and devise strategic solutions. We evaluate our method on the TfD benchmark of the TEACH dataset and achieve state-of-the-art performance, outperforming a baseline without error recovery by 11.5% and surpassing the strongest existing model by 19%.
- Abstract(参考訳): 複雑なタスクを実行するエージェントは、実行障害の影響を受けやすく、効果的な障害復旧メカニズムの必要性を動機付けている。
本研究では,ゼロショット連鎖プロンプトを用いた条件付き多段階故障復旧フレームワークを提案する。
フレームワークは4つのエラー処理ステージで構成されており、3つのタスク実行中に動作し、1つは実行後のリフレクションフェーズとして機能する。
提案手法は, LLMの推論能力を活用し, 環境条件下での実行課題を分析し, 戦略的解決策を考案する。
提案手法はTEACHデータセットのTfDベンチマークを用いて評価し,誤差回復のないベースラインを11.5%上回り,最強の既存モデルを19%上回った。
関連論文リスト
- Fast Adaptation with Behavioral Foundation Models [82.34700481726951]
教師なしゼロショット強化学習は、行動基礎モデルの事前学習のための強力なパラダイムとして登場した。
有望な結果にもかかわらず、ゼロショットポリシーは、教師なしのトレーニングプロセスによって引き起こされるエラーにより、しばしば準最適である。
本稿では,事前訓練されたBFMの低次元タスク埋め込み空間を探索し,ゼロショットポリシーの性能を急速に向上させる高速適応手法を提案する。
論文 参考訳(メタデータ) (2025-04-10T16:14:17Z) - Why Do Multi-Agent LLM Systems Fail? [91.39266556855513]
MAST(Multi-Agent System Failure taxonomy, MAST)は,MASの故障を理解するために考案された分類法である。
我々は、200以上のタスクにまたがる7つの人気のあるMASフレームワークを分析し、6つの専門家のアノテータを含む。
14のユニークな障害モードを特定し、(i)仕様問題、(ii)エージェント間ミスアライメント、(iii)タスク検証の3つに分類した。
論文 参考訳(メタデータ) (2025-03-17T19:04:38Z) - Devil's Advocate: Anticipatory Reflection for LLM Agents [53.897557605550325]
我々のアプローチは、LLMエージェントに対して、与えられたタスクを管理可能なサブタスクに分解するように促す。
イントロスペクティブ・イントロスペクティブ・イントロスペクティブ・イントロスペクティブ(introspective intervention)を3回実施する。
潜在的な障害の予測と、アクション実行前の代替策。
サブタスクの目的とのポストアクションアライメントと、計画実行における最大限の努力を保証するための改善によるバックトラック。
論文 参考訳(メタデータ) (2024-05-25T19:20:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。