論文の概要: Conditional Deep Generative Models for Belief State Planning
- arxiv url: http://arxiv.org/abs/2505.11698v1
- Date: Fri, 16 May 2025 21:06:41 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-20 14:57:10.788877
- Title: Conditional Deep Generative Models for Belief State Planning
- Title(参考訳): 状態計画のための条件付き深部生成モデル
- Authors: Antoine Bigeard, Anthony Corso, Mykel Kochenderfer,
- Abstract要約: 本研究では, 条件付き深層生成モデル (cDGM) を用いて信念を表現する手法を提案する。
我々は,無作為なロールアウト軌跡から得られたデータに基づいてcDGMを訓練し,鉱物探査POMDPの解法の有効性を示した。
cDGMは、信頼度と計画性能の両方のタスク非依存の尺度において、粒子フィルタのベースラインを上回ります。
- 参考スコア(独自算出の注目度): 2.000434989156371
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Partially observable Markov decision processes (POMDPs) are used to model a wide range of applications, including robotics, autonomous vehicles, and subsurface problems. However, accurately representing the belief is difficult for POMDPs with high-dimensional states. In this paper, we propose a novel approach that uses conditional deep generative models (cDGMs) to represent the belief. Unlike traditional belief representations, cDGMs are well-suited for high-dimensional states and large numbers of observations, and they can generate an arbitrary number of samples from the posterior belief. We train the cDGMs on data produced by random rollout trajectories and show their effectiveness in solving a mineral exploration POMDP with a large and continuous state space. The cDGMs outperform particle filter baselines in both task-agnostic measures of belief accuracy as well as in planning performance.
- Abstract(参考訳): 部分的に観測可能なマルコフ決定プロセス(POMDP)は、ロボット工学、自動運転車、地下問題など幅広い応用をモデル化するために用いられる。
しかし、高次元状態のPOMDPでは、その信念を正確に表現することは困難である。
本稿では,条件付き深層生成モデル (cDGM) を用いて信念を表現する手法を提案する。
従来の信念表現とは異なり、cDGMは高次元状態や多数の観測に適しており、後続の信念から任意の数のサンプルを生成することができる。
ランダムなロールアウトトラジェクトリによって生成されたデータに基づいてcDGMをトレーニングし、大規模かつ連続的な状態空間を持つ鉱物探査PMDPの解法の有効性を示す。
cDGMは、信頼度と計画性能の両方のタスク非依存の尺度において、粒子フィルタのベースラインを上回ります。
関連論文リスト
- 1-2-3-Go! Policy Synthesis for Parameterized Markov Decision Processes via Decision-Tree Learning and Generalization [0.8795040582681393]
特に、パラメータ化されたマルコフ決定過程をインスタンス化するときに状態空間は極端に大きくなる。
我々は,そのような巨大なMDPに対して合理的な政策を得るための学習に基づくアプローチを提案する。
論文 参考訳(メタデータ) (2024-10-23T21:57:05Z) - Semi-Supervised Model-Free Bayesian State Estimation from Compressed Measurements [57.04370580292727]
圧縮測定によるベイズ状態の推定について考察する。
時間的測定ベクトルの寸法は、推定される時間的状態ベクトルの寸法よりも小さい。
状態の進化の基盤となる力学モデルは「モデルフリープロセス」では未知数である。
論文 参考訳(メタデータ) (2024-07-10T05:03:48Z) - Deep Generative Models through the Lens of the Manifold Hypothesis: A Survey and New Connections [15.191007332508198]
本研究では,低内在次元のデータモデリングにおいて,高周囲次元の確率の数値的不安定性は避けられないことを示す。
次に、オートエンコーダの学習表現上のDGMは、ワッサーシュタイン距離をほぼ最小化するものとして解釈できることを示す。
論文 参考訳(メタデータ) (2024-04-03T18:00:00Z) - FaDIn: Fast Discretized Inference for Hawkes Processes with General
Parametric Kernels [82.53569355337586]
この研究は、有限なサポートを持つ一般パラメトリックカーネルを用いた時間点プロセス推論の効率的な解を提供する。
脳磁図(MEG)により記録された脳信号からの刺激誘発パターンの発生をモデル化し,その有効性を評価する。
その結果,提案手法により,最先端技術よりもパターン遅延の推定精度が向上することが示唆された。
論文 参考訳(メタデータ) (2022-10-10T12:35:02Z) - Riemannian Score-Based Generative Modeling [56.20669989459281]
経験的性能を示すスコアベース生成モデル(SGM)を紹介する。
現在のSGMは、そのデータが平坦な幾何学を持つユークリッド多様体上で支えられているという前提を定めている。
これにより、ロボット工学、地球科学、タンパク質モデリングの応用にこれらのモデルを使用することができない。
論文 参考訳(メタデータ) (2022-02-06T11:57:39Z) - Scaling Structured Inference with Randomization [64.18063627155128]
本稿では、構造化されたモデルを数万の潜在状態に拡張するためにランダム化された動的プログラミング(RDP)のファミリを提案する。
我々の手法は古典的DPベースの推論に広く適用できる。
また、自動微分とも互換性があり、ニューラルネットワークとシームレスに統合できる。
論文 参考訳(メタデータ) (2021-12-07T11:26:41Z) - Controlled Gaussian Process Dynamical Models with Application to Robotic
Cloth Manipulation [10.04778213256535]
我々は高次元非線形力学学習のための制御ガウス過程力学モデル(CGPDM)を提案する。
CGPDMは低次元の潜在空間で構成され、外部制御変数が作用できる関連するダイナミクスを持つ。
幅広い動作を一般化し、これまで目に見えない一連の制御動作によって得られた布の動きを確実に予測することができる。
論文 参考訳(メタデータ) (2021-03-11T11:34:12Z) - Planning in Markov Decision Processes with Gap-Dependent Sample
Complexity [48.98199700043158]
マルコフ決定過程における計画のための新しいトラジェクトリに基づくモンテカルロ木探索アルゴリズム MDP-GapE を提案する。
我々は, MDP-GapE に要求される生成モデルに対する呼び出し回数の上限を証明し, 確率の高い準最適動作を同定する。
論文 参考訳(メタデータ) (2020-06-10T15:05:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。