論文の概要: Perception-Based Beliefs for POMDPs with Visual Observations
- arxiv url: http://arxiv.org/abs/2602.05679v1
- Date: Thu, 05 Feb 2026 14:01:39 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-06 18:49:08.963507
- Title: Perception-Based Beliefs for POMDPs with Visual Observations
- Title(参考訳): 視覚的観察によるPOMDPの知覚に基づく信念
- Authors: Miriam Schäfers, Merlijn Krale, Thiago D. Simão, Nils Jansen, Maximilian Weininger,
- Abstract要約: 本稿では,従来の信念とフィルタリングに基づく解法を補完するPMDPsフレームワーク(PBP)について紹介する。
PBPは分布を直接信念更新に組み込むため、基礎となる解法は高次元の観測空間に対して明示的に推論する必要はない。
PBPを2つの従来のPOMDPソルバを用いて実装し、既存のエンドツーエンドのRL法よりも優れていることを示す。
- 参考スコア(独自算出の注目度): 18.92543972270551
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Partially observable Markov decision processes (POMDPs) are a principled planning model for sequential decision-making under uncertainty. Yet, real-world problems with high-dimensional observations, such as camera images, remain intractable for traditional belief- and filtering-based solvers. To tackle this problem, we introduce the Perception-based Beliefs for POMDPs framework (PBP), which complements such solvers with a perception model. This model takes the form of an image classifier which maps visual observations to probability distributions over states. PBP incorporates these distributions directly into belief updates, so the underlying solver does not need to reason explicitly over high-dimensional observation spaces. We show that the belief update of PBP coincides with the standard belief update if the image classifier is exact. Moreover, to handle classifier imprecision, we incorporate uncertainty quantification and introduce two methods to adjust the belief update accordingly. We implement PBP using two traditional POMDP solvers and empirically show that (1) it outperforms existing end-to-end deep RL methods and (2) uncertainty quantification improves robustness of PBP against visual corruption.
- Abstract(参考訳): 部分的に観測可能なマルコフ決定プロセス(POMDP)は、不確実性の下でのシーケンシャルな意思決定の計画モデルである。
しかし、カメラ画像のような高次元観測による現実の問題は、伝統的な信念やフィルタリングに基づく解法にとって難解なままである。
この問題に対処するために、知覚モデルを用いてこれらの解を補完するPOMDPsフレームワーク(PBP)のパーセプションベースの信念を導入する。
このモデルは、視覚的観察を状態上の確率分布にマッピングする画像分類器の形式をとる。
PBPはこれらの分布を直接信念の更新に組み込むので、基礎となる解法は高次元の観測空間に対して明示的に推論する必要はない。
PBPの信念更新は、画像分類器が正確であれば標準信念更新と一致することを示す。
さらに,分類器の精度を改善するために,不確実性の定量化を取り入れ,それに応じて信念の更新を調整する2つの方法を導入する。
2つの従来のPOMDPソルバを用いてPBPを実装し、(1)既存のエンドツーエンドの深いRL法よりも優れた性能を示し、(2)不確実な定量化により、PBPの視覚的腐敗に対する堅牢性が向上することを示した。
関連論文リスト
- ESCORT: Efficient Stein-variational and Sliced Consistency-Optimized Temporal Belief Representation for POMDPs [7.361361150597151]
ESCORTは高次元の信念空間における複雑な多モード分布を捉えるための粒子ベースのフレームワークである。
ESCORTはSVGDを拡張し、状態次元間の依存関係をモデル化する相関対応プロジェクションと、相関構造を保持しながら更新を安定化する時間的一貫性の制約である。
各種次元のPOMDPドメインと合成多モード分布の両領域における広範囲な評価により, ESCORTの有効性を実証した。
論文 参考訳(メタデータ) (2025-10-24T02:51:33Z) - Observation Adaptation via Annealed Importance Resampling for Partially Observable Markov Decision Processes [4.830416359005018]
部分観測可能なマルコフ決定過程(POMDPs)は、状態不確実性の下での環境における逐次決定のための一般的な数学的モデルである。
オンラインソルバは通常、信念分布を更新するための重要再サンプリングに基づいてブートストラップ粒子フィルタを使用する。
本稿では,モンテカルロの反復的なステップを通して,状態遷移と最適分布の間のブリッジ分布の列を構築する手法を提案する。
論文 参考訳(メタデータ) (2025-03-25T03:05:00Z) - Unifying Perplexing Behaviors in Modified BP Attributions through Alignment Perspective [61.5509267439999]
GBP, RectGrad, LRP, DTD などの手法の統一理論フレームワークを提案する。
活性化ニューロンの重みを結合して入力アライメントを実現することを実証した。
このアライメントにより、可視化品質が向上し、重量ランダム化に対する感度が低下する。
論文 参考訳(メタデータ) (2025-03-14T07:58:26Z) - Pessimistic Iterative Planning with RNNs for Robust POMDPs [39.12002323036052]
堅牢なPOMDPのポリシーは、部分的な可観測性のためにメモリベースでなければならない。
本稿では,悲観的反復計画(PIP)フレームワークを提案する。
PIP内では、繰り返しニューラルネットワークを最適化してFSCを計算するrFSCNetアルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-08-16T14:25:20Z) - Towards Motion Forecasting with Real-World Perception Inputs: Are
End-to-End Approaches Competitive? [93.10694819127608]
実世界の知覚入力を用いた予測手法の統一評価パイプラインを提案する。
我々の詳細な調査では、キュレートされたデータから知覚ベースのデータへ移行する際の大きなパフォーマンスギャップが明らかになりました。
論文 参考訳(メタデータ) (2023-06-15T17:03:14Z) - Optimality Guarantees for Particle Belief Approximation of POMDPs [55.83001584645448]
部分的に観測可能なマルコフ決定プロセス(POMDP)は、現実の意思決定と制御の問題に対する柔軟な表現を提供する。
POMDPは、特に状態と観測空間が連続的またはハイブリッドである場合、解決するのが非常に難しい。
本稿では,これらのアルゴリズムが使用する粒子フィルタリング手法の近似誤差を特徴付ける理論を提案する。
論文 参考訳(メタデータ) (2022-10-10T21:11:55Z) - Consistency Regularization for Deep Face Anti-Spoofing [69.70647782777051]
顔認証システムでは、顔認証(FAS)が重要な役割を担っている。
このエキサイティングな観察によって、異なる視点の特徴整合性を促進することが、FASモデルを促進するための有望な方法かもしれないと推測する。
FASにおけるEPCR(Embeddding-level and Prediction-level Consistency Regularization)とEPCR(Embeddding-level Consistency Regularization)を併用した。
論文 参考訳(メタデータ) (2021-11-24T08:03:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。