論文の概要: Seeing Isn't Believing: Mitigating Belief Inertia via Active Intervention in Embodied Agents
- arxiv url: http://arxiv.org/abs/2604.17252v1
- Date: Sun, 19 Apr 2026 04:36:33 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-21 21:52:52.417987
- Title: Seeing Isn't Believing: Mitigating Belief Inertia via Active Intervention in Embodied Agents
- Title(参考訳): 信じないものを見る: 炭水化物中における能動的介入による不活性化の軽減
- Authors: Hanlin Wang, Chak Tou Leong, Jian Wang, Wenjie Li,
- Abstract要約: Estimate-Verify-Update (EVU)は、テキストの信条を明示的に生成する統合的な介入機構である。
EVUは一貫してタスクの成功率を大幅に向上させる。
我々のアプローチは、信念の慣性を効果的に軽減し、より堅牢なエンボディエージェントの開発を進めます。
- 参考スコア(独自算出の注目度): 20.463811944310475
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Recent advancements in large language models (LLMs) have enabled agents to tackle complex embodied tasks through environmental interaction. However, these agents still make suboptimal decisions and perform ineffective actions, as they often overlook critical environmental feedback that differs from their internal beliefs. Through a formal probing analysis, we characterize this as belief inertia, a phenomenon where agents stubbornly adhere to prior beliefs despite explicit observations. To address this, we advocate active belief intervention, moving from passive understanding to active management. We introduce the Estimate-Verify-Update (EVU) mechanism, which empowers agents to predict expected outcomes, verify them against observations through explicit reasoning, and actively update prior beliefs based on the verification evidence. EVU is designed as a unified intervention mechanism that generates textual belief states explicitly, and can be integrated into both prompting-based and training-based agent reasoning methods. Extensive experiments across three embodied benchmarks demonstrate that EVU consistently yields substantial gains in task success rates. Further analyses validate that our approach effectively mitigates belief inertia, advancing the development of more robust embodied agents. Our code is available at https://github.com/WangHanLinHenry/EVU.
- Abstract(参考訳): 大規模言語モデル(LLM)の最近の進歩により、エージェントは環境相互作用を通じて複雑な実施課題に取り組むことができる。
しかし、これらのエージェントは、内的信念と異なる重要な環境フィードバックを見落としていることが多いため、依然として最適な判断を下し、非効果的な行動を行う。
フォーマルな調査分析を通じて、エージェントが明確な観察にもかかわらず、従来の信念に頑固に固執する現象である信念慣性(inertia)を特徴付ける。
そこで我々は,受動的理解から積極的管理へと移行し,積極的な信条介入を提唱する。
本稿では,予測結果の予測,明示的推論による観察に対する検証,検証証拠に基づく事前信念の更新を積極的に行うEVU機構を紹介する。
EVUは、テキストの信条を明示的に生成する統一的な介入機構として設計されており、プロンプトベースのエージェント推論手法とトレーニングベースのエージェント推論手法の両方に統合することができる。
3つの具体的ベンチマークによる大規模な実験は、EVUが一貫してタスクの成功率を大幅に向上させることを示した。
さらなる分析により、我々のアプローチは信念の慣性を効果的に軽減し、より堅牢なエンボディエージェントの開発を促進することが検証された。
私たちのコードはhttps://github.com/WangHanLinHenry/EVU.comで公開されています。
関連論文リスト
- AgentV-RL: Scaling Reward Modeling with Agentic Verifier [63.55502685076245]
試験時間スケーリング(TTS)によるLCM推論を強化する検証器が実証されている。
本稿では,報酬モデリングを多ターンツール拡張型検討プロセスに変換するフレームワークであるエージェント検証を提案する。
Agentic Verifier は並列およびシーケンシャルTS の両方で一貫した性能向上が得られることを示す。
論文 参考訳(メタデータ) (2026-04-17T12:27:36Z) - ActFER: Agentic Facial Expression Recognition via Active Tool-Augmented Visual Reasoning [55.562958315741646]
本稿では, アクティブな視覚的エビデンス獲得とマルチモーダル推論を兼ね備えたエージェントフレームワークであるActFERを提案する。
さらに,エージェントFERに適した強化学習アルゴリズムである実用性キャリブレーションGRPOを開発した。
論文 参考訳(メタデータ) (2026-04-10T05:53:19Z) - Verify Before You Commit: Towards Faithful Reasoning in LLM Agents via Self-Auditing [5.497064111008921]
我々は,行動開始前のエージェントの内部信頼状態に対する検証を行う新しいフレームワークであるtextbfSelf-textbfAudited textbfVerified textbfReasoning (textscSAVeR)を提案する。
当社のアプローチは、競争力のあるエンドタスクのパフォーマンスを維持しながら、推論の忠実さを継続的に改善します。
論文 参考訳(メタデータ) (2026-04-09T16:01:03Z) - Gaming the Judge: Unfaithful Chain-of-Thought Can Undermine Agent Evaluation [76.5533899503582]
大規模言語モデル(LLM)は、エージェントのパフォーマンスを評価するために、ますます裁判官として使われている。
このパラダイムは、エージェントのチェーン・オブ・シークレット(CoT)推論が内部の推論と環境状態の両方を忠実に反映していることを暗黙的に仮定している。
我々は、操作された推論だけで、様々なWebタスクにまたがる800の軌跡に対して、最先端のVLM審査員の偽陽性率を最大90%向上させることができることを実証した。
論文 参考訳(メタデータ) (2026-01-21T06:07:43Z) - Learning to Seek Evidence: A Verifiable Reasoning Agent with Causal Faithfulness Analysis [10.749786847079163]
医学のような高度な領域におけるAIモデルの説明は、しばしば信頼性を欠いているため、信頼を妨げる可能性がある。
本稿では,対話型エージェントを提案する。
このポリシーは強化学習を用いて最適化され、効率的かつ一般化可能なモデルとなる。
論文 参考訳(メタデータ) (2025-11-03T10:21:35Z) - LatentGuard: Controllable Latent Steering for Robust Refusal of Attacks and Reliable Response Generation [4.29885665563186]
LATENTGUARDは、行動アライメントと教師付き潜在空間制御を組み合わせて、解釈可能で正確な安全操縦を行うフレームワークである。
本研究は, 実用性を損なうことなく, 安全性制御性と応答解釈性の両方を向上することを示す。
論文 参考訳(メタデータ) (2025-09-24T07:31:54Z) - Helpful Agent Meets Deceptive Judge: Understanding Vulnerabilities in Agentic Workflows [41.97051158610974]
本研究は, 詐欺的あるいは誤解を招くフィードバックの下で, エージェント的堅牢性の体系的解析を行う。
我々は、最強のエージェントでさえ説得力に弱いが欠陥のある批判に弱いことを明らかにした。
本研究は,フィードバックに基づく堅牢性の基本的脆弱性を強調し,より堅牢なエージェントシステム構築のためのガイダンスを提供する。
論文 参考訳(メタデータ) (2025-06-03T19:26:23Z) - Sim-to-Real Causal Transfer: A Metric Learning Approach to Causally-Aware Interaction Representations [58.96953392466609]
エージェント相互作用の現代的表現の因果認識を詳細に検討する。
近年の表現は、非因果剤の摂動に対して部分的に耐性があることが示されている。
本稿では,因果アノテーションを用いて潜在表現を規則化するメトリクス学習手法を提案する。
論文 参考訳(メタデータ) (2023-12-07T18:57:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。