論文の概要: AGWM: Affordance-Grounded World Models for Environments with Compositional Prerequisites
- arxiv url: http://arxiv.org/abs/2605.06841v1
- Date: Thu, 07 May 2026 18:46:44 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-11 19:43:38.553069
- Title: AGWM: Affordance-Grounded World Models for Environments with Compositional Prerequisites
- Title(参考訳): AGWM: 構成的前提条件を持つ環境のためのアフォーマンス周囲の世界モデル
- Authors: Qinshi Zhang, Weipeng Deng, Zhihan Jiang, Jiaming Qu, Qianren Li, Weitao Xu, Ray LC,
- Abstract要約: 我々は,行動の動的実行可能性を明確に追跡するために,前提条件依存のDAGとして表される抽象的な空き構造を学習するAGWM(Affordance-Grounded World Model)を提案する。
ゲームベースのシミュレーション環境の実験では、より低いマルチステップ予測誤差、新しい構成へのより良い一般化、解釈可能性の向上により、本手法の有効性が示された。
- 参考スコア(独自算出の注目度): 18.635313325437664
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In model-based learning, the agent learns behaviors by simulating trajectories based on world model predictions. Standard world models typically learn a stationary transition function that maps states and actions to next states, when an action and an outcome frequently co-occur in training data, the model tends to internalize this correlation as a general causal rule while ignoring action preconditions. In interactive environments, however, agent actions can reshape the future affordance space. At each timestep, an action may becomes executable only after its prerequisites are met, or non-executable when they are destroyed. We term such events structure-changing events (SC events). As a result, a conventional world model often fails to determine whether a given action is executable in the current state, especially in multi-step predictions. Each imagined step is conditioned on an incorrect affordance state, and therefore the prediction error compounds over the rollout horizon. In this paper, we propose AGWM (Affordance-Grounded World Model), which learns an abstract affordance structure represented as a DAG of prerequisite dependencies to explicitly track the dynamic executability of actions. Experiments on game-based simulated environments demonstrate the effectiveness of our method by achieving lower multi-step prediction error, better generalization to novel configurations, and improved interpretability.
- Abstract(参考訳): モデルに基づく学習では、エージェントは世界モデル予測に基づいて軌道をシミュレートすることで行動を学ぶ。
標準世界モデルは、通常、状態とアクションを次の状態にマッピングする定常遷移関数を学習するが、アクションと結果がトレーニングデータで頻繁に共起する場合、そのモデルは、アクションの前提条件を無視しながら、この相関を一般的な因果規則として内部化する傾向がある。
しかし、対話的な環境では、エージェントアクションは将来の余裕空間を形作ることができる。
各段階において、アクションは、その前提条件が満たされた後にのみ実行可能となり、あるいは破壊されると実行不可能になる。
このようなイベントをSCイベント(Structure-changing Event)と呼ぶ。
結果として、従来の世界モデルは、与えられたアクションが現在の状態、特に多段階予測で実行可能かどうかを判断できないことが多い。
予測された各ステップは不正確な割当状態に条件付けされ、したがってロールアウト地平線上の予測エラー化合物が生じる。
本稿では,Affordance-Grounded World Modelを提案する。Affordance-Grounded World Modelは,行動の動的実行可能性を明示的に追跡するために,前提条件依存のDAGとして表される抽象的な空き構造を学習する。
ゲームベースのシミュレーション環境の実験では、より低いマルチステップ予測誤差、新しい構成へのより良い一般化、解釈可能性の向上により、本手法の有効性が示された。
関連論文リスト
- Learning Lifted Action Models from Unsupervised Visual Traces [38.479081137300945]
本研究では,状態予測,行動予測,持ち上げ行動モデルなどを共同で学習するディープラーニングフレームワークを提案する。
また,予測崩壊や自己強化エラーを防止するために,MILP(mixed-integer linear program)を導入する。
複数の領域にわたる実験により、MILPベースの補正を統合することで、モデルが局所最適から逃れ、一貫した解へと収束することを示す。
論文 参考訳(メタデータ) (2026-04-21T03:49:04Z) - Towards Real-world Human Behavior Simulation: Benchmarking Large Language Models on Long-horizon, Cross-scenario, Heterogeneous Behavior Traces [81.41397370235102]
我々はOmniBehaviorを紹介した。OmniBehaviorは実世界のデータから構築された最初のユーザシミュレーションベンチマークである。
現在のモデルでは,コンテキストウィンドウが拡大しても,複雑な振る舞いを正確にシミュレートすることが困難であることを示す。
この結果、個人差や長い尾の挙動が失われ、将来の高忠実度シミュレーション研究における重要な方向性が浮き彫りになる。
論文 参考訳(メタデータ) (2026-04-09T15:26:21Z) - World Action Verifier: Self-Improving World Models via Forward-Inverse Asymmetry [82.93104394404781]
汎用世界モデルは、スケーラブルなポリシー評価、最適化、計画を約束します。
本稿では,世界モデルによる予測誤りと自己改善を識別するフレームワークであるWorld Action Verifier(WAV)を提案する。
論文 参考訳(メタデータ) (2026-04-02T12:48:36Z) - Specification-Driven Generation and Evaluation of Discrete-Event World Models via the DEVS Formalism [9.578714623643291]
我々は,明示的なシミュレータの信頼性と学習モデルの柔軟性を両立させる原理的な中間層を求める。
我々は、自然言語仕様から直接合成された明示的で実行可能な離散的世界モデルを提案する。
論文 参考訳(メタデータ) (2026-03-04T06:50:32Z) - On Sample-Efficient Generalized Planning via Learned Transition Models [8.508980351550003]
一般的な計画は、共通のドメインモデルを共有する計画問題のファミリーにまたがって一般化するソリューション戦略の構築を研究する。
近年のPlanGPTやPlansformerのようなトランスフォーマーベースのプランナーは、直接アクションシーケンス予測として一般的な計画を立てた。
遷移モデル学習問題として一般化計画を定式化し、ニューラルネットワークが後続状態関数 $hat approx $ を明示的に近似し、シンボル状態軌跡をロールアウトして計画を生成する。
論文 参考訳(メタデータ) (2026-02-26T16:13:46Z) - MOTIF: Learning Action Motifs for Few-shot Cross-Embodiment Transfer [55.982504915794514]
クロス・エボディメント・ポリシーは一般的に共有プライベート・アーキテクチャに依存している。
本報告では,MOTIFを効率よく数発のクロスボディーメントトランスファーに適用する。
我々はMOTIFが数発の転送シナリオにおいて強いベースラインを著しく上回ることを示す。
論文 参考訳(メタデータ) (2026-02-14T13:21:40Z) - Reshaping Action Error Distributions for Reliable Vision-Language-Action Models [69.38615670891038]
ロボット操作において、視覚言語アクション(VLA)モデルは、一般化可能でスケーラブルなロボットポリシーを学ぶための有望なパラダイムとして登場した。
連続動作型VLAモデルに焦点をあて、トレーニング中の動作誤差分布を再構成することにより、従来のMSEベースの回帰を超越する。
複数の代表的VLAアーキテクチャ上で、標準、少数ショット、ノイズの多い設定にまたがるアプローチを評価します。
論文 参考訳(メタデータ) (2026-02-04T05:37:09Z) - Learning Time-Aware Causal Representation for Model Generalization in Evolving Domains [50.66049136093248]
動的因果要因と因果機構のドリフトを組み込んだ時間認識型構造因果モデル(SCM)を開発した。
本研究では,時間領域毎に最適な因果予測値が得られることを示す。
合成と実世界の両方のデータセットの結果から,SynCは時間的一般化性能に優れることが示された。
論文 参考訳(メタデータ) (2025-06-21T14:05:37Z) - Human locomotor control timescales depend on the environmental context and sensory input modality [37.48294298569551]
制御時間スケールを定量化する統合データ駆動フレームワークを提案する。
ウォーキングやランニングといったタスクにこのフレームワークを適用します。
本研究の枠組みは,ロポモタ・フット配置制御の時間尺度に影響を与える要因を明らかにする。
論文 参考訳(メタデータ) (2025-03-20T16:57:15Z) - Towards Out-of-Distribution Sequential Event Prediction: A Causal
Treatment [72.50906475214457]
シーケンシャルなイベント予測の目標は、一連の歴史的なイベントに基づいて次のイベントを見積もることである。
実際には、次のイベント予測モデルは、一度に収集されたシーケンシャルなデータで訓練される。
文脈固有の表現を学習するための階層的な分岐構造を持つフレームワークを提案する。
論文 参考訳(メタデータ) (2022-10-24T07:54:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。