論文の概要: Perception-Based Beliefs for POMDPs with Visual Observations
- arxiv url: http://arxiv.org/abs/2602.05679v1
- Date: Thu, 05 Feb 2026 14:01:39 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-06 18:49:08.963507
- Title: Perception-Based Beliefs for POMDPs with Visual Observations
- Title(参考訳): 視覚的観察によるPOMDPの知覚に基づく信念
- Authors: Miriam Schäfers, Merlijn Krale, Thiago D. Simão, Nils Jansen, Maximilian Weininger,
- Abstract要約: 本稿では,従来の信念とフィルタリングに基づく解法を補完するPMDPsフレームワーク(PBP)について紹介する。
PBPは分布を直接信念更新に組み込むため、基礎となる解法は高次元の観測空間に対して明示的に推論する必要はない。
PBPを2つの従来のPOMDPソルバを用いて実装し、既存のエンドツーエンドのRL法よりも優れていることを示す。
- 参考スコア(独自算出の注目度): 18.92543972270551
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Partially observable Markov decision processes (POMDPs) are a principled planning model for sequential decision-making under uncertainty. Yet, real-world problems with high-dimensional observations, such as camera images, remain intractable for traditional belief- and filtering-based solvers. To tackle this problem, we introduce the Perception-based Beliefs for POMDPs framework (PBP), which complements such solvers with a perception model. This model takes the form of an image classifier which maps visual observations to probability distributions over states. PBP incorporates these distributions directly into belief updates, so the underlying solver does not need to reason explicitly over high-dimensional observation spaces. We show that the belief update of PBP coincides with the standard belief update if the image classifier is exact. Moreover, to handle classifier imprecision, we incorporate uncertainty quantification and introduce two methods to adjust the belief update accordingly. We implement PBP using two traditional POMDP solvers and empirically show that (1) it outperforms existing end-to-end deep RL methods and (2) uncertainty quantification improves robustness of PBP against visual corruption.
- Abstract(参考訳): 部分的に観測可能なマルコフ決定プロセス(POMDP)は、不確実性の下でのシーケンシャルな意思決定の計画モデルである。
しかし、カメラ画像のような高次元観測による現実の問題は、伝統的な信念やフィルタリングに基づく解法にとって難解なままである。
この問題に対処するために、知覚モデルを用いてこれらの解を補完するPOMDPsフレームワーク(PBP)のパーセプションベースの信念を導入する。
このモデルは、視覚的観察を状態上の確率分布にマッピングする画像分類器の形式をとる。
PBPはこれらの分布を直接信念の更新に組み込むので、基礎となる解法は高次元の観測空間に対して明示的に推論する必要はない。
PBPの信念更新は、画像分類器が正確であれば標準信念更新と一致することを示す。
さらに,分類器の精度を改善するために,不確実性の定量化を取り入れ,それに応じて信念の更新を調整する2つの方法を導入する。
2つの従来のPOMDPソルバを用いてPBPを実装し、(1)既存のエンドツーエンドの深いRL法よりも優れた性能を示し、(2)不確実な定量化により、PBPの視覚的腐敗に対する堅牢性が向上することを示した。
関連論文リスト
- Benchmarking Uncertainty Quantification of Plug-and-Play Diffusion Priors for Inverse Problems Solving [9.725628125621718]
プラグ・アンド・プレイ拡散先行(DP)は科学・工学分野における逆問題解決の強力なパラダイムとなっている。
しかし、現在の評価では、単一サンプル上でのポイント推定精度の指標を強調している。
逆問題では、所望の分布は典型的には再構成よりも後続分布であるが、既存のベンチマークは単一の再構成出力のみを評価する。
論文 参考訳(メタデータ) (2026-02-04T04:02:32Z) - ESCORT: Efficient Stein-variational and Sliced Consistency-Optimized Temporal Belief Representation for POMDPs [7.361361150597151]
ESCORTは高次元の信念空間における複雑な多モード分布を捉えるための粒子ベースのフレームワークである。
ESCORTはSVGDを拡張し、状態次元間の依存関係をモデル化する相関対応プロジェクションと、相関構造を保持しながら更新を安定化する時間的一貫性の制約である。
各種次元のPOMDPドメインと合成多モード分布の両領域における広範囲な評価により, ESCORTの有効性を実証した。
論文 参考訳(メタデータ) (2025-10-24T02:51:33Z) - Observation Adaptation via Annealed Importance Resampling for Partially Observable Markov Decision Processes [4.830416359005018]
部分観測可能なマルコフ決定過程(POMDPs)は、状態不確実性の下での環境における逐次決定のための一般的な数学的モデルである。
オンラインソルバは通常、信念分布を更新するための重要再サンプリングに基づいてブートストラップ粒子フィルタを使用する。
本稿では,モンテカルロの反復的なステップを通して,状態遷移と最適分布の間のブリッジ分布の列を構築する手法を提案する。
論文 参考訳(メタデータ) (2025-03-25T03:05:00Z) - Unifying Perplexing Behaviors in Modified BP Attributions through Alignment Perspective [61.5509267439999]
GBP, RectGrad, LRP, DTD などの手法の統一理論フレームワークを提案する。
活性化ニューロンの重みを結合して入力アライメントを実現することを実証した。
このアライメントにより、可視化品質が向上し、重量ランダム化に対する感度が低下する。
論文 参考訳(メタデータ) (2025-03-14T07:58:26Z) - Pessimistic Iterative Planning with RNNs for Robust POMDPs [39.12002323036052]
堅牢なPOMDPのポリシーは、部分的な可観測性のためにメモリベースでなければならない。
本稿では,悲観的反復計画(PIP)フレームワークを提案する。
PIP内では、繰り返しニューラルネットワークを最適化してFSCを計算するrFSCNetアルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-08-16T14:25:20Z) - Provably Efficient UCB-type Algorithms For Learning Predictive State
Representations [55.00359893021461]
逐次決定問題は、予測状態表現(PSR)によってモデル化された低ランク構造が認められる場合、統計的に学習可能である
本稿では,推定モデルと実モデル間の全変動距離を上限とする新しいボーナス項を特徴とする,PSRに対する最初のUCB型アプローチを提案する。
PSRに対する既存のアプローチとは対照的に、UCB型アルゴリズムは計算的トラクタビリティ、最優先の準最適ポリシー、モデルの精度が保証される。
論文 参考訳(メタデータ) (2023-07-01T18:35:21Z) - Towards Motion Forecasting with Real-World Perception Inputs: Are
End-to-End Approaches Competitive? [93.10694819127608]
実世界の知覚入力を用いた予測手法の統一評価パイプラインを提案する。
我々の詳細な調査では、キュレートされたデータから知覚ベースのデータへ移行する際の大きなパフォーマンスギャップが明らかになりました。
論文 参考訳(メタデータ) (2023-06-15T17:03:14Z) - Federated Conformal Predictors for Distributed Uncertainty
Quantification [83.50609351513886]
コンフォーマル予測は、機械学習において厳密な不確実性定量化を提供するための一般的なパラダイムとして現れつつある。
本稿では,共形予測を連邦学習環境に拡張する。
本稿では、FL設定に適した部分交換可能性の弱い概念を提案し、それをフェデレート・コンフォーマル予測フレームワークの開発に利用する。
論文 参考訳(メタデータ) (2023-05-27T19:57:27Z) - Piecewise Deterministic Markov Processes for Bayesian Neural Networks [19.5426096350075]
現代のベイズニューラルネットワーク(BNN)の推論は、しばしば変分推論処理に依存し、独立性や後部の形態に反する仮定を示唆する。
新しいPiecewise Deterministic Markov Process (PDMP) サンプリングはサブサンプリングを許容するが、サンプリングが難しい不均一なPoisson Process (IPP) モデルを導入する。
本研究はIPPからのサンプリングのための新しい汎用的かつ適応的なスライニング手法を導入し、BNNにおける推論のためのPDMPの適用をいかに加速するかを示す。
論文 参考訳(メタデータ) (2023-02-17T06:38:16Z) - Optimality Guarantees for Particle Belief Approximation of POMDPs [55.83001584645448]
部分的に観測可能なマルコフ決定プロセス(POMDP)は、現実の意思決定と制御の問題に対する柔軟な表現を提供する。
POMDPは、特に状態と観測空間が連続的またはハイブリッドである場合、解決するのが非常に難しい。
本稿では,これらのアルゴリズムが使用する粒子フィルタリング手法の近似誤差を特徴付ける理論を提案する。
論文 参考訳(メタデータ) (2022-10-10T21:11:55Z) - Flow-based Recurrent Belief State Learning for POMDPs [20.860726518161204]
部分的に観測可能なマルコフ決定プロセス(POMDP)は、実世界のシーケンシャルな意思決定プロセスをモデル化するための原則的で汎用的なフレームワークを提供する。
主な課題は、観測不能な環境状態の確率分布である信念状態をどのように正確に取得するかである。
近年のディープラーニング技術の進歩は、良き信念状態を学ぶ大きな可能性を示している。
論文 参考訳(メタデータ) (2022-05-23T05:29:55Z) - Consistency Regularization for Deep Face Anti-Spoofing [69.70647782777051]
顔認証システムでは、顔認証(FAS)が重要な役割を担っている。
このエキサイティングな観察によって、異なる視点の特徴整合性を促進することが、FASモデルを促進するための有望な方法かもしれないと推測する。
FASにおけるEPCR(Embeddding-level and Prediction-level Consistency Regularization)とEPCR(Embeddding-level Consistency Regularization)を併用した。
論文 参考訳(メタデータ) (2021-11-24T08:03:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。