論文の概要: Is the Future Compatible? Diagnosing Dynamic Consistency in World Action Models
- arxiv url: http://arxiv.org/abs/2605.07514v1
- Date: Fri, 08 May 2026 09:44:43 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-11 19:43:38.97277
- Title: Is the Future Compatible? Diagnosing Dynamic Consistency in World Action Models
- Title(参考訳): 未来は相容れないか?世界行動モデルにおける動的一貫性の診断
- Authors: Bo-Kai Ruan, Teng-Fang Hsiao, Ling Lo, Hong-Han Shuai,
- Abstract要約: 世界行動モデル(WAM)は、将来の観察と行動を予測することにより、想像上のロールアウトを通じて意思決定を可能にする。
動作状態の整合性、予測された動作と誘導された状態遷移の整合性を、WAMの信頼性の欠如の軸として同定する。
テスト時間選択のための価値のないコンセンサス戦略を導入し、予測される未来間での合意によって、候補のロールアウトをランク付けする。
- 参考スコア(独自算出の注目度): 28.165928090888986
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: World Action Models (WAMs) enable decision-making through imagined rollouts by predicting future observations and actions. However, the reliability of these imagined futures remains under-examined: is a generated future merely visually plausible, or is it dynamically compatible with the action sequence it claims to model? In this work, we identify action-state consistency, the alignment between predicted actions and induced state transitions, as a missing reliability axis for WAMs. Through a systematic study across representative joint-prediction and inverse-dynamics models, we find that action-state consistency systematically separates successful and failed rollouts across many tasks and follows similar success-failure trends as learned value estimates. These results suggest that consistency captures decision-relevant structure beyond visual realism. We further identify background collapse as an important boundary condition, where low-dynamics failed trajectories can become deceptively consistent because static futures are easier to predict. Building on these findings, we introduce a value-free consensus strategy for test-time selection, which ranks candidate rollouts by agreement among predicted futures. This strategy improves success rates on RoboCasa and RoboTwin 2.0 without additional training or reward modeling. Taken together, our findings establish action-state consistency as both a diagnostic tool for evaluating WAM reliability and a practical signal for value-free planning.
- Abstract(参考訳): 世界行動モデル(WAM)は、将来の観察と行動を予測することにより、想像上のロールアウトを通じて意思決定を可能にする。
生成した未来は単に視覚的に可視性があるだけなのか、あるいはモデルとして主張するアクションシーケンスと動的に互換性があるのか?
本研究では, 動作状態の整合性, 予測動作と誘導状態遷移の整合性を, WAMの信頼性の欠如の軸として同定する。
代表的な共同予測モデルと逆力学モデルにまたがる系統的研究により、動作状態の整合性は、多くのタスクにわたる成功と失敗のロールアウトを系統的に分離し、学習値の推定と同様の成功と失敗の傾向に従うことが判明した。
これらの結果は、一貫性が視覚的リアリズムを超えた決定関連構造を捉えていることを示唆している。
静的な未来は予測し易く,低ダイナミックな軌道不整形が知覚的に一貫した状態となるような,背景崩壊を重要な境界条件とみなす。
これらの知見に基づいて,テスト時間選択のための価値のないコンセンサス戦略を導入し,予測される未来間での合意によって,候補のロールアウトをランク付けする。
この戦略は、追加のトレーニングや報酬モデリングなしで、RoboCasaとRoboTwin 2.0の成功率を改善する。
本研究は、WAM信頼性を評価するための診断ツールと、価値のない計画のための実用的な信号として、行動状態整合性を確立した。
関連論文リスト
- When to Trust Imagination: Adaptive Action Execution for World Action Models [42.51856318901667]
世界行動モデル(WAM)は、近ごろ、将来の視覚的観察と将来の行動を共同で予測することによって、ロボット操作のための有望なパラダイムとして登場した。
現在のWAMは、各モデル推論の後、一定の数の予測アクションを実行し、ロボットは、想像された未来が実際の物理的なロールアウトと一致しているかどうかを無視する。
我々は,将来性検証問題として適応型WAM実行を定式化し,WAM予測された未来が信頼性を保ちながらロボットはより長く実行すべきであり,現実が想像力から逸脱した場合にはより早く再計画する。
論文 参考訳(メタデータ) (2026-05-07T13:18:28Z) - ESIA: An Energy-Based Spatiotemporal Interaction-Aware Framework for Pedestrian Intention Prediction [24.45524909253344]
自動運転の最近の進歩は、歩行者の意図予測の研究を動機付けている。
既存の研究は、単純化されたマルチエージェント相互作用パターン、不透明な推論論理、グローバルな行動予測の欠如によって制約されている。
本研究では,歩行者と環境をノードとして扱うための条件ランダムフィールド(CRF)に基づくパラダイムを提案する。
論文 参考訳(メタデータ) (2026-04-26T14:13:58Z) - World Action Verifier: Self-Improving World Models via Forward-Inverse Asymmetry [82.93104394404781]
汎用世界モデルは、スケーラブルなポリシー評価、最適化、計画を約束します。
本稿では,世界モデルによる予測誤りと自己改善を識別するフレームワークであるWorld Action Verifier(WAV)を提案する。
論文 参考訳(メタデータ) (2026-04-02T12:48:36Z) - LatentPilot: Scene-Aware Vision-and-Language Navigation by Dreaming Ahead with Latent Visual Reasoning [51.969318585152116]
LatentPilotは、トレーニング中の将来の観察を貴重なデータソースとして利用して、アクション条件付きビジュアルダイナミクスを学習する。
そこで本稿では,フライホイール方式のトレーニング機構を提案する。これは,道路上の軌道を反復的に収集し,エージェントの行動分布に適合するようにモデルを再訓練する。
R2R-CE、RxR-CE、R2R-PEベンチマークの実験では新たなSOTA結果が得られた。
論文 参考訳(メタデータ) (2026-03-31T02:21:59Z) - From Passive Metric to Active Signal: The Evolving Role of Uncertainty Quantification in Large Language Models [77.04403907729738]
このサーベイは、受動的診断基準からリアルタイムモデル動作を導くアクティブ制御信号への不確実性の進化をグラフ化する。
3つのフロンティアにまたがるアクティブ制御信号として不確実性がいかに活用されているかを示す。
この調査は、次世代のスケーラブルで信頼性があり、信頼できるAIを構築するためには、新しい不確実性のトレンドを習得することが不可欠である、と論じている。
論文 参考訳(メタデータ) (2026-01-22T06:21:31Z) - VISTA: A Vision and Intent-Aware Social Attention Framework for Multi-Agent Trajectory Prediction [4.4382802228131455]
マルチエージェント軌道予測のための目標条件変換器 VISTA を提案する。
高密度のMADRASベンチマークでは、VISTAは最先端の精度を実現し、衝突は大幅に少ない。
これらの結果から, VISTAは社会的に適合し, 目標を意識し, 解釈可能な軌道を生成することがわかった。
論文 参考訳(メタデータ) (2025-11-13T11:17:01Z) - UF-RNN: Real-Time Adaptive Motion Generation Using Uncertainty-Driven Foresight Prediction [4.849928323880955]
状態が不確実な環境で効果的に動作するためのロボットの訓練は、ロボット工学における長年の課題である。
本稿では、標準時系列予測とアクティブな「フォレスト」モジュールを組み合わせたモデルである、不確実性駆動型フォレストリカレントニューラルネットワーク(UF-RNN)を提案する。
UF-RNNは、その潜在空間における自己誘起カオス力学を活用することにより、堅牢な適応を示す。
これらの結果は、不確実性駆動型フォレストを模倣学習パイプラインに統合することで、予測不可能な現実世界の状況に対処するロボットの能力を著しく向上させることができることを示唆している。
論文 参考訳(メタデータ) (2025-10-11T13:44:20Z) - Ego-centric Predictive Model Conditioned on Hand Trajectories [52.531681772560724]
自我中心のシナリオでは、次の行動とその視覚的結果の両方を予測することは、人間と物体の相互作用を理解するために不可欠である。
我々は,エゴセントリックなシナリオにおける行動と視覚的未来を共同でモデル化する,統合された2段階予測フレームワークを提案する。
我々のアプローチは、エゴセントリックな人間の活動理解とロボット操作の両方を扱うために設計された最初の統一モデルである。
論文 参考訳(メタデータ) (2025-08-27T13:09:55Z) - Realistic Adversarial Attacks for Robustness Evaluation of Trajectory Prediction Models via Future State Perturbation [1.124958340749622]
軌道予測は自動運転車システムの重要な要素である。
現在のアプローチでは、周囲のエージェントの過去の位置を乱すことに重点を置いている。
本稿では,これらの対向軌道の現実性と影響を評価するための新しい性能指標を提案する。
論文 参考訳(メタデータ) (2025-05-09T15:40:32Z) - Uncertainty-boosted Robust Video Activity Anticipation [72.14155465769201]
ビデオアクティビティの予測は、ロボットビジョンから自動運転まで幅広い応用可能性を受け入れることで、将来何が起こるかを予測することを目的としている。
近年の進展にもかかわらず、コンテンツ進化過程やイベントラベルの動的相関として反映されたデータ不確実性問題は、何らかの形で無視されている。
本研究では,予測結果の信頼性を示す不確実な値を生成する,不確実性を考慮した頑健なビデオアクティビティ予測フレームワークを提案する。
論文 参考訳(メタデータ) (2024-04-29T12:31:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。