論文の概要: Simplified Continuous High Dimensional Belief Space Planning with
Adaptive Probabilistic Belief-dependent Constraints
- arxiv url: http://arxiv.org/abs/2302.06697v1
- Date: Mon, 13 Feb 2023 21:22:47 GMT
- ステータス: 処理完了
- システム内更新日: 2023-02-15 17:05:48.468989
- Title: Simplified Continuous High Dimensional Belief Space Planning with
Adaptive Probabilistic Belief-dependent Constraints
- Title(参考訳): 適応確率的信念依存制約による簡易連続的高次元信念空間計画
- Authors: Andrey Zhitnikov, Vadim Indelman
- Abstract要約: 部分的に観測可能な領域における不確実性、あるいはBelief Space Planningとしても知られる場合、オンライン意思決定は根本的な問題である。
本稿では,確率論的信念に依存した制約に対して,適応的に行動列を受理あるいは破棄する手法を提案する。
本手法を高次元空間計画の課題であるアクティブSLAMに適用する。
- 参考スコア(独自算出の注目度): 9.061408029414453
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Online decision making under uncertainty in partially observable domains,
also known as Belief Space Planning, is a fundamental problem in robotics and
Artificial Intelligence. Due to an abundance of plausible future unravelings,
calculating an optimal course of action inflicts an enormous computational
burden on the agent. Moreover, in many scenarios, e.g., information gathering,
it is required to introduce a belief-dependent constraint. Prompted by this
demand, in this paper, we consider a recently introduced probabilistic
belief-dependent constrained POMDP. We present a technique to adaptively accept
or discard a candidate action sequence with respect to a probabilistic
belief-dependent constraint, before expanding a complete set of future
observations samples and without any loss in accuracy. Moreover, using our
proposed framework, we contribute an adaptive method to find a maximal feasible
return (e.g., information gain) in terms of Value at Risk for the candidate
action sequence with substantial acceleration. On top of that, we introduce an
adaptive simplification technique for a probabilistically constrained setting.
Such an approach provably returns an identical-quality solution while
dramatically accelerating online decision making. Our universal framework
applies to any belief-dependent constrained continuous POMDP with parametric
beliefs, as well as nonparametric beliefs represented by particles. In the
context of an information-theoretic constraint, our presented framework
stochastically quantifies if a cumulative information gain along the planning
horizon is sufficiently significant (e.g. for, information gathering, active
SLAM). We apply our method to active SLAM, a highly challenging problem of high
dimensional Belief Space Planning. Extensive realistic simulations corroborate
the superiority of our proposed ideas.
- Abstract(参考訳): 部分的に観測可能な領域でのオンライン意思決定は、Belief Space Planningとしても知られ、ロボティクスと人工知能の基本的な問題である。
予測可能な未来の発見が豊富にあるため、最適な行動経路を計算すると、エージェントに大きな計算負荷がかかる。
さらに、情報収集などの多くのシナリオでは、信念に依存した制約を導入する必要がある。
本稿では,近年導入された確率論的信念依存制約付きpomdpについて考察する。
本稿では,将来の観測サンプルの完全な集合を拡張する前に,確率的信念依存制約に関して候補行動系列を適応的に受け入れ,あるいは破棄する手法を提案する。
さらに,提案手法を用いて,提案手法を応用して,候補行動系列に有意なアクセラレーションを施すリスクのある値の観点で,最大実現可能な戻り値(情報ゲインなど)を求める適応手法を提案する。
さらに,確率的に制約された設定に対する適応的単純化手法を提案する。
このようなアプローチは、オンライン意思決定を劇的に加速しながら、同じ品質のソリューションを確実に返します。
我々の普遍的枠組みは、粒子で表される非パラメトリックな信念と同様に、パラメトリックな信念を持つ任意の信念依存的制約付き連続POMDPに適用される。
情報理論的制約の文脈において,提案フレームワークは,情報収集,アクティブSLAMなど,計画地平線に沿った累積的な情報取得が十分に重要であるかどうかを統計的に定量化する。
本研究では,高次元空間計画の課題であるアクティブSLAMに適用する。
広範に現実的なシミュレーションは、提案したアイデアの優越性を裏付ける。
関連論文リスト
- Uncertainty Quantification for Forward and Inverse Problems of PDEs via
Latent Global Evolution [110.99891169486366]
本稿では,効率的かつ高精度な不確実性定量化を深層学習に基づく代理モデルに統合する手法を提案する。
本手法は,フォワード問題と逆問題の両方に対して,堅牢かつ効率的な不確実性定量化機能を備えたディープラーニングに基づく代理モデルを提案する。
提案手法は, 長期予測を含むシナリオに適合し, 拡張された自己回帰ロールアウトに対する不確かさの伝播に優れる。
論文 参考訳(メタデータ) (2024-02-13T11:22:59Z) - Online Constraint Tightening in Stochastic Model Predictive Control: A
Regression Approach [49.056933332667114]
確率制約付き最適制御問題に対する解析解は存在しない。
制御中の制約強調パラメータをオンラインで学習するためのデータ駆動型アプローチを提案する。
提案手法は, 確率制約を厳密に満たす制約強調パラメータを導出する。
論文 参考訳(メタデータ) (2023-10-04T16:22:02Z) - Online POMDP Planning with Anytime Deterministic Guarantees [11.157761902108692]
不確実性の下での計画は、部分的に観測可能なマルコフ決定プロセス(POMDP)を用いて数学的に定式化できる
POMDPの最適計画を見つけるには計算コストがかかり、小さなタスクにのみ適用可能である。
簡便な解と理論的に最適な解との決定論的関係を導出する。
論文 参考訳(メタデータ) (2023-10-03T04:40:38Z) - Risk Aware Belief-dependent Constrained POMDP Planning [9.061408029414453]
リスク認識は、オンライン操作エージェントの基本である。
既存の制約付きPOMDPアルゴリズムは一般に離散状態と観測空間のために設計されている。
本稿では,リスク・逆信念に依存した制約付きPMDPの新たな定式化について述べる。
論文 参考訳(メタデータ) (2022-09-06T17:48:13Z) - Is Vertical Logistic Regression Privacy-Preserving? A Comprehensive
Privacy Analysis and Beyond [57.10914865054868]
垂直ロジスティック回帰(VLR)をミニバッチ降下勾配で訓練した。
我々は、オープンソースのフェデレーション学習フレームワークのクラスにおいて、VLRの包括的で厳密なプライバシー分析を提供する。
論文 参考訳(メタデータ) (2022-07-19T05:47:30Z) - Reinforcement Learning with a Terminator [80.34572413850186]
我々は, TerMDP のパラメータを学習し, 推定問題の構造を活用し, 状態ワイドな信頼境界を提供する。
我々はこれらを用いて証明可能な効率のよいアルゴリズムを構築し、終端を考慮し、その後悔を抑える。
論文 参考訳(メタデータ) (2022-05-30T18:40:28Z) - The Unreasonable Effectiveness of Deep Evidential Regression [72.30888739450343]
不確実性を考慮した回帰ベースニューラルネットワーク(NN)による新しいアプローチは、従来の決定論的手法や典型的なベイズ的NNよりも有望であることを示している。
我々は、理論的欠点を詳述し、合成および実世界のデータセットのパフォーマンスを分析し、Deep Evidential Regressionが正確な不確実性ではなく定量化であることを示す。
論文 参考訳(メタデータ) (2022-05-20T10:10:32Z) - Robustness Guarantees for Credal Bayesian Networks via Constraint
Relaxation over Probabilistic Circuits [16.997060715857987]
本研究では,決定関数のロバスト性を,断続ベイズ的ネットワークに対して定量化する手法を開発した。
回路サイズにおいて線形時間で MARmax 上の保証上限を得る方法を示す。
論文 参考訳(メタデータ) (2022-05-11T22:37:07Z) - Counterfactual Explanations as Interventions in Latent Space [62.997667081978825]
反現実的な説明は、望ましい結果を達成するために変更が必要な機能のセットをエンドユーザに提供することを目的としています。
現在のアプローチでは、提案された説明を達成するために必要な行動の実現可能性を考慮することはめったにない。
本稿では,非現実的説明を生成する手法として,潜時空間における干渉としての対実的説明(CEILS)を提案する。
論文 参考訳(メタデータ) (2021-06-14T20:48:48Z) - Online POMDP Planning via Simplification [10.508187462682306]
信念依存報酬を考慮したPOMDP計画への新しいアプローチを開発しています。
我々のアプローチは、元の問題の最適解を見つけることは保証されているが、かなりのスピードアップがある。
これらの境界と単純化がサンプル数の減少に対応し,計算速度が大幅に向上するシミュレーション手法を検証した。
論文 参考訳(メタデータ) (2021-05-11T18:46:08Z) - Adaptive Belief Discretization for POMDP Planning [7.508023795800546]
多くのPOMDPソルバは、信念空間を均一に識別し、(一般に不明な)カバー数の観点から計画誤差を与える。
適応的信念の識別方式を提案し,それに関連する計画誤差を与える。
私達は私達のアルゴリズムがさまざまなシナリオの最先端の技術と競争が高いことを証明します。
論文 参考訳(メタデータ) (2021-04-15T07:04:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。