論文の概要: Learning Lifted Action Models from Unsupervised Visual Traces
- arxiv url: http://arxiv.org/abs/2604.19043v1
- Date: Tue, 21 Apr 2026 03:49:04 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-22 22:41:49.603884
- Title: Learning Lifted Action Models from Unsupervised Visual Traces
- Title(参考訳): 教師なしの視覚的トレースからリフテッドアクションモデルを学ぶ
- Authors: Kai Xi, Stephen Gould, Sylvie Thiébaux,
- Abstract要約: 本研究では,状態予測,行動予測,持ち上げ行動モデルなどを共同で学習するディープラーニングフレームワークを提案する。
また,予測崩壊や自己強化エラーを防止するために,MILP(mixed-integer linear program)を導入する。
複数の領域にわたる実験により、MILPベースの補正を統合することで、モデルが局所最適から逃れ、一貫した解へと収束することを示す。
- 参考スコア(独自算出の注目度): 38.479081137300945
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Efficient construction of models capturing the preconditions and effects of actions is essential for applying AI planning in real-world domains. Extensive prior work has explored learning such models from high-level descriptions of state and/or action sequences. In this paper, we tackle a more challenging setting: learning lifted action models from sequences of state images, without action observation. We propose a deep learning framework that jointly learns state prediction, action prediction, and a lifted action model. We also introduce a mixed-integer linear program (MILP) to prevent prediction collapse and self-reinforcing errors among predictions. The MILP takes the predicted states, actions, and action model over a subset of traces and solves for logically consistent states, actions, and action model that are as close as possible to the original predictions. Pseudo-labels extracted from the MILP solution are then used to guide further training. Experiments across multiple domains show that integrating MILP-based correction helps the model escape local optima and converge toward globally consistent solutions.
- Abstract(参考訳): 実世界のドメインにAI計画を適用するためには、事前条件と行動の効果を捉えるモデルの効率的な構築が不可欠である。
広範囲にわたる先行研究は、状態および/またはアクションシーケンスの高レベルな記述からそのようなモデルを学ぶことを検討した。
本稿では,動作観察を伴わずに,状態画像のシーケンスから持ち上げられた行動モデルを学ぶという,より困難な状況に対処する。
本研究では,状態予測,行動予測,持ち上げ行動モデルなどを共同で学習するディープラーニングフレームワークを提案する。
また,予測の崩壊や自己強化エラーを防止するために,MILP(Mixed-integer linear program)を導入する。
MILPは、予測された状態、アクション、アクションモデルをトレースのサブセットの上に取り込んで、元の予測に可能な限り近い論理的に一貫した状態、アクション、アクションモデルを解決する。
その後、MILP溶液から抽出した擬似ラベルを用いてさらなるトレーニングを指導する。
複数の領域にわたる実験により、MILPベースの補正を統合することで、モデルが局所最適から逃れ、一貫した解へと収束することを示す。
関連論文リスト
- Ego-centric Predictive Model Conditioned on Hand Trajectories [52.531681772560724]
自我中心のシナリオでは、次の行動とその視覚的結果の両方を予測することは、人間と物体の相互作用を理解するために不可欠である。
我々は,エゴセントリックなシナリオにおける行動と視覚的未来を共同でモデル化する,統合された2段階予測フレームワークを提案する。
我々のアプローチは、エゴセントリックな人間の活動理解とロボット操作の両方を扱うために設計された最初の統一モデルである。
論文 参考訳(メタデータ) (2025-08-27T13:09:55Z) - From Marginal to Joint Predictions: Evaluating Scene-Consistent Trajectory Prediction Approaches for Automated Driving [4.795092023802721]
マージナル予測モデルは、通常、各エージェントの将来の軌跡を独立して予測する。
合同予測モデルは、エージェント間の相互作用を明示的に説明し、社会的および物理的に一貫した予測をもたらす。
予測精度,多モード性,推論効率の観点から各手法の評価を行った。
論文 参考訳(メタデータ) (2025-07-07T17:58:53Z) - Human locomotor control timescales depend on the environmental context and sensory input modality [37.48294298569551]
制御時間スケールを定量化する統合データ駆動フレームワークを提案する。
ウォーキングやランニングといったタスクにこのフレームワークを適用します。
本研究の枠組みは,ロポモタ・フット配置制御の時間尺度に影響を与える要因を明らかにする。
論文 参考訳(メタデータ) (2025-03-20T16:57:15Z) - ACT-JEPA: Novel Joint-Embedding Predictive Architecture for Efficient Policy Representation Learning [90.41852663775086]
ACT-JEPAは模倣学習と自己教師型学習を統合する新しいアーキテクチャである。
我々はアクションシーケンスと抽象的な観察シーケンスを予測するポリシーを訓練する。
実験の結果,ACT-JEPAは時間環境の動的学習によって表現の質を向上させることがわかった。
論文 参考訳(メタデータ) (2025-01-24T16:41:41Z) - Annealed Winner-Takes-All for Motion Forecasting [48.200282332176094]
本稿では,AWTAの損失を最先端のモーション予測モデルと統合して性能を向上させる方法を示す。
我々の手法は、WTAを用いて訓練された任意の軌道予測モデルに容易に組み込むことができる。
論文 参考訳(メタデータ) (2024-09-17T13:26:17Z) - Bootstrapped model learning and error correction for planning with
uncertainty in model-based RL [1.370633147306388]
自然の目的は、環境のダイナミクスを正確に反映したモデルを学ぶことである。
本稿では,不確実性を考慮した強化学習エージェントによるモデルミス特定の問題について検討する。
本稿では,将来の状態と報酬の分布を学習するブートストラップ型マルチヘッドニューラルネットワークを提案する。
論文 参考訳(メタデータ) (2020-04-15T15:41:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。