論文の概要: Generative-Model Predictive Planning for Navigation in Partially Observable Environments
- arxiv url: http://arxiv.org/abs/2606.18888v1
- Date: Wed, 17 Jun 2026 10:06:39 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-18 17:16:51.109049
- Title: Generative-Model Predictive Planning for Navigation in Partially Observable Environments
- Title(参考訳): 部分観測可能な環境におけるナビゲーションのための生成モデル予測計画
- Authors: Thomas Quilter, Yifan Zhu, Guorui Quan, Mingfei Sun, Samuel Kaski,
- Abstract要約: 部分的に観測可能な環境でのナビゲーションは、自律的なエージェントにとって大きな課題となる。
生成と計画の両方の利点を組み合わせた新しいフレームワークであるBeliefDiffusionを紹介します。
本研究では,BeliefDiffusionが,ナビゲーション成功率と経路効率において,モデルフリー強化学習ベースラインと他の生成的アプローチの両方を著しく上回っていることを示す。
- 参考スコア(独自算出の注目度): 24.136726050820698
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Navigation in partially observable environments presents a significant challenge for autonomous agents, requiring effective decision-making with limited sensory information in unknown environments. Belief-based methods, particularly those using neural networks to approximate the belief space, often fail to capture the inherent multimodality of belief spaces, especially in high-dimensional cases with perceptual aliasing. While generative models present a compelling alternative, they typically require substantial data or expert demonstrations and lack explicit mechanisms for long-term planning. In this paper, we introduce BeliefDiffusion, a novel framework that combines the benefits of both generation and planning. BeliefDiffusion leverages diffusion models to explicitly characterize multimodal belief distributions and utilizes Model Predictive Control (MPC) to simultaneously plan ahead. It consists of two steps: (1) Imagining plausible environment configurations based on observation history and (2) Planning efficient navigation strategies across an aggregated configurations. Through extensive experiments in synthetic map environments, we demonstrate that BeliefDiffusion significantly outperforms both model-free reinforcement learning baselines and other generative approaches in navigation success rate and path efficiency. Our results validate that explicitly incorporating multimodal belief representations into planning enables more robust navigation in partially observable settings.
- Abstract(参考訳): 部分的に観測可能な環境でのナビゲーションは、未知の環境で限られた感覚情報を持つ効果的な意思決定を必要とする自律エージェントにとって重要な課題である。
信念に基づく手法、特にニューラルネットワークを用いて信念空間を近似する手法は、特に知覚的エイリアスを伴う高次元の場合において、信念空間の固有の多義性を捉えるのに失敗することが多い。
生成モデルは魅力的な代替手段を提供するが、典型的にはかなりのデータや専門家によるデモンストレーションを必要とし、長期計画のための明確なメカニズムが欠如している。
本稿では,生成と計画の両方の利点を組み合わせた新しいフレームワークであるBeliefDiffusionを紹介する。
BeliefDiffusion は拡散モデルを利用してマルチモーダルな信念分布を明示的に特徴づけ、モデル予測制御 (MPC) を用いて同時に計画する。
本研究は,(1)観測履歴に基づく可塑性環境構成の想像と,(2)集約された環境構成を横断する効率的なナビゲーション戦略の計画という2つのステップから構成される。
合成地図環境における広範囲な実験を通して,BeliefDiffusionは,ナビゲーション成功率と経路効率において,モデルフリー強化学習ベースラインと他の生成的アプローチの両方を著しく上回っていることを実証した。
本研究は,マルチモーダルな信念表現を計画に明示的に組み込むことによって,部分的に観測可能な環境でより堅牢なナビゲーションが可能であることを検証した。
関連論文リスト
- Model-Based Diffusion Sampling for Predictive Control in Offline Decision Making [48.998030470623384]
オフラインの意思決定は、さらなるインタラクションを伴わずに、固定データセットからの信頼性の高い振る舞いを必要とする。
i)タスク整列軌道を多様に生成するプランナー,(ii)システム力学との整合性を強制するダイナミクスモデル,(iii)タスク目標に整合した動作を選択するランサーモジュールからなる構成モデルに基づく拡散フレームワークを提案する。
論文 参考訳(メタデータ) (2025-12-09T06:26:02Z) - Unified Multimodal Vessel Trajectory Prediction with Explainable Navigation Intention [18.699213433572996]
船舶軌道予測は、インテリジェント海洋システムの基本である。
既存の船舶軌道予測手法は、限られたシナリオ適用性と説明性に乏しい。
本稿では,説明可能なナビゲーション意図を取り入れた統合型船舶軌道予測フレームワークを提案する。
論文 参考訳(メタデータ) (2025-11-18T08:56:30Z) - RainDiff: End-to-end Precipitation Nowcasting Via Token-wise Attention Diffusion [64.49056527678606]
本稿では,U-Net拡散モデルだけでなく,レーダ時間エンコーダにも統合されたトークンワイドアテンションを提案する。
従来の手法とは異なり,本手法は,画素空間拡散の典型的な高資源コストを発生させることなく,アーキテクチャに注意を集中させる。
実験と評価により,提案手法は複雑な降水予測シナリオにおいて,最先端の手法,ロバストネスの局所的忠実度,一般化,優位性を著しく上回ることを示した。
論文 参考訳(メタデータ) (2025-10-16T17:59:13Z) - StateSpaceDiffuser: Bringing Long Context to Diffusion World Models [52.92249035412797]
本稿では、状態空間モデルから機能を統合することで、拡散モデルが長時間コンテキストタスクの実行を可能にするStateSpaceDiffuserを紹介する。
この設計は拡散モデルの高忠実性合成を保ちながら長期記憶を復元する。
論文 参考訳(メタデータ) (2025-05-28T11:27:54Z) - Consistent World Models via Foresight Diffusion [56.45012929930605]
我々は、一貫した拡散に基づく世界モデルを学習する上で重要なボトルネックは、最適下予測能力にあると主張している。
本稿では,拡散に基づく世界モデリングフレームワークであるForesight Diffusion(ForeDiff)を提案する。
論文 参考訳(メタデータ) (2025-05-22T10:01:59Z) - Latent Diffusion Planning for Imitation Learning [78.56207566743154]
Latent Diffusion Planning (LDP) は、プランナーと逆ダイナミクスモデルからなるモジュラーアプローチである。
行動予測からプランニングを分離することにより、LDPは最適なデータと行動自由データのより密集した監視信号の恩恵を受けることができる。
シミュレーションされた視覚ロボット操作タスクにおいて、LDPは最先端の模倣学習アプローチより優れている。
論文 参考訳(メタデータ) (2025-04-23T17:53:34Z) - Predictive Planner for Autonomous Driving with Consistency Models [5.966385886363771]
軌道予測と計画は、自動運転車が動的環境下で安全かつ効率的に走行するために不可欠である。
近年の拡散型生成モデルはマルチエージェント軌道生成において有望であるが,その遅いサンプリングは高周波計画タスクには適さない。
我々は,エゴ車両の航法目標に基づいて,エゴと周辺エージェントの共同分布からサンプルを採取する予測プランナを構築するために,一貫性モデルを活用する。
論文 参考訳(メタデータ) (2025-02-12T00:26:01Z) - Scene-Aware Explainable Multimodal Trajectory Prediction [15.58042746234974]
説明可能な条件拡散に基づくマルチモーダル軌道予測(DMTP)モデルを提案する。
本モデルでは,マルチモーダルな軌道パターンを捉えるために条件拡散法を改良し,大域的特徴とシナリオ固有の特徴の意義を評価するためにシェープ値モデルを改良した。
実験により,本モデルが重要な入力の同定に優れ,精度でベースラインモデルよりも優れていることが示された。
論文 参考訳(メタデータ) (2024-10-22T08:17:33Z) - Versatile Navigation under Partial Observability via Value-guided Diffusion Policy [14.967107015417943]
部分観測可能条件下での2次元および3次元経路計画のための多目的拡散に基づくアプローチを提案する。
具体的には、価値誘導拡散政策は、まず様々な段階にわたって行動を予測する計画を生成する。
次に、状態推定を伴う微分可能なプランナーを用いて値関数を導出し、エージェントの探索とゴール探索の振る舞いを指示する。
論文 参考訳(メタデータ) (2024-04-01T19:52:08Z) - Beyond DAGs: A Latent Partial Causal Model for Multimodal Learning [80.44084021062105]
本稿では,非方向エッジで連結された2つの潜在結合変数を特徴とする,多モーダルデータに対する新しい潜在部分因果モデルを提案する。
特定の統計的仮定の下では、多モーダル・コントラッシブ・ラーニングによって学習された表現が、自明な変換までの潜在結合変数に対応することを示す。
事前トレーニングされたCLIPモデルの実験は、非絡み合った表現を具現化し、数ショットの学習を可能にし、さまざまな現実世界のデータセットにわたるドメインの一般化を改善する。
論文 参考訳(メタデータ) (2024-02-09T07:18:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。