論文の概要: Learning Visual Planning Models from Partially Observed Images
- arxiv url: http://arxiv.org/abs/2211.15666v1
- Date: Fri, 25 Nov 2022 07:00:56 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-30 14:44:39.597314
- Title: Learning Visual Planning Models from Partially Observed Images
- Title(参考訳): 部分観察画像からの視覚的計画モデル学習
- Authors: Kebing Jin, Zhanhao Xiao, Hankui Hankz Zhuo, Hai Wan, Jiaran Cai
- Abstract要約: 部分的に観察された原画像トレースから遷移モデルを学習するための新しいフレームワークであるaTypeRecplanを提供する。
また、与えられた目標観測距離を推定するモデルを学ぶためのニューラルネットワークベースのアプローチを提案する。
本手法は,不完全な観測環境下での視覚計画モデル学習の最先端手法よりも効果的である。
- 参考スコア(独自算出の注目度): 17.25694427734666
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: There has been increasing attention on planning model learning in classical
planning. Most existing approaches, however, focus on learning planning models
from structured data in symbolic representations. It is often difficult to
obtain such structured data in real-world scenarios. Although a number of
approaches have been developed for learning planning models from fully observed
unstructured data (e.g., images), in many scenarios raw observations are often
incomplete. In this paper, we provide a novel framework, \aType{Recplan}, for
learning a transition model from partially observed raw image traces. More
specifically, by considering the preceding and subsequent images in a trace, we
learn the latent state representations of raw observations and then build a
transition model based on such representations. Additionally, we propose a
neural-network-based approach to learn a heuristic model that estimates the
distance toward a given goal observation. Based on the learned transition model
and heuristic model, we implement a classical planner for images. We exhibit
empirically that our approach is more effective than a state-of-the-art
approach of learning visual planning models in the environment with incomplete
observations.
- Abstract(参考訳): 古典的計画における計画モデル学習に注目が集まっている。
しかし、既存のアプローチのほとんどは、構造化データから計画モデルを学ぶことに焦点を当てている。
このような構造化データを現実のシナリオで取得することは、しばしば困難である。
完全に観測された非構造化データ(画像など)から計画モデルを学ぶための多くのアプローチが開発されているが、多くのシナリオでは生の観測は不完全であることが多い。
本稿では,部分的に観察された生画像から遷移モデルを学習するための新しいフレームワークである \aType{Recplan} を提案する。
より具体的には、トレース中の前後の画像を考慮し、生の観測の潜在状態表現を学習し、そのような表現に基づいて遷移モデルを構築する。
さらに,与えられた目標観測距離を推定するヒューリスティックモデルをニューラルネットワークで学習する手法を提案する。
学習した遷移モデルとヒューリスティックモデルに基づいて,画像のための古典的なプランナーを実装した。
不完全な観察を伴う環境下での視覚計画モデル学習の最先端アプローチよりも,我々のアプローチの方が有効であることを示す。
関連論文リスト
- Reinforcing Pre-trained Models Using Counterfactual Images [54.26310919385808]
本稿では,言語誘導型生成対実画像を用いた分類モデル強化のための新しいフレームワークを提案する。
逆ファクト画像データセットを用いてモデルをテストすることにより、モデルの弱点を同定する。
我々は、分類モデルを微調整し強化するために、デファクトイメージを拡張データセットとして採用する。
論文 参考訳(メタデータ) (2024-06-19T08:07:14Z) - Sequential Modeling Enables Scalable Learning for Large Vision Models [120.91839619284431]
本稿では,言語データを用いずにLVM(Large Vision Model)を学習できる新しい逐次モデリング手法を提案する。
我々は、生画像やビデオや注釈付きデータソースを表現できる共通フォーマット「視覚文」を定義した。
論文 参考訳(メタデータ) (2023-12-01T18:59:57Z) - Compositional Foundation Models for Hierarchical Planning [52.18904315515153]
本稿では,言語,視覚,行動データを個別に訓練し,長期的課題を解決するための基礎モデルを提案する。
我々は,大規模なビデオ拡散モデルを用いて,環境に根ざした記号的計画を構築するために,大規模言語モデルを用いている。
生成したビデオプランは、生成したビデオからアクションを推論する逆ダイナミクスモデルを通じて、視覚運動制御に基礎を置いている。
論文 参考訳(メタデータ) (2023-09-15T17:44:05Z) - Planning with Diffusion for Flexible Behavior Synthesis [125.24438991142573]
我々は、できるだけ多くの軌道最適化パイプラインをモデリング問題に折り畳むことがどう見えるか検討する。
我々の技術的アプローチの核心は、軌道を反復的にデノベーションすることで計画する拡散確率モデルにある。
論文 参考訳(メタデータ) (2022-05-20T07:02:03Z) - Visual Learning-based Planning for Continuous High-Dimensional POMDPs [81.16442127503517]
Visual Tree Search (VTS)は、オフラインで学習した生成モデルとオンラインモデルベースのPOMDP計画を組み合わせた学習と計画の手順である。
VTSは、モンテカルロの木探索プランナーにおける画像観測の可能性を予測し評価するために、一連の深部生成観測モデルを利用することで、オフラインモデルトレーニングとオンラインプランニングを橋渡しする。
VTSは、異なる観測ノイズに対して堅牢であり、オンラインのモデルベースプランニングを利用するため、再トレーニングを必要とせずに、異なる報酬構造に適応できることを示す。
論文 参考訳(メタデータ) (2021-12-17T11:53:31Z) - Recommending Metamodel Concepts during Modeling Activities with
Pre-Trained Language Models [0.0]
複数のモデリングシナリオにおいて関連ドメインの概念を推奨することにより、メタモデルの設計においてモデラーを支援するアプローチを提案する。
私たちのアプローチでは、ドメインから知識を抽出したり、完了ルールを手作業で設計する必要はありません。
モデルトレーニング中に見つからない166のメタモデルを含むテストセットに対するアプローチを5000以上のテストサンプルを用いて評価した。
論文 参考訳(メタデータ) (2021-04-04T16:29:10Z) - Forethought and Hindsight in Credit Assignment [62.05690959741223]
我々は、前向きモデルや後向きモデルによる後向き操作による予測として使われる計画の利益と特異性を理解するために活動する。
本稿では,予測を(再)評価すべき状態の選択に主眼を置いて,計画におけるモデルの利用について検討する。
論文 参考訳(メタデータ) (2020-10-26T16:00:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。