論文の概要: iX-BSP: Incremental Belief Space Planning
- arxiv url: http://arxiv.org/abs/2102.09539v1
- Date: Thu, 18 Feb 2021 18:35:14 GMT
- ステータス: 処理完了
- システム内更新日: 2021-02-19 14:15:08.890914
- Title: iX-BSP: Incremental Belief Space Planning
- Title(参考訳): iX-BSP:Incremental Belief Space Planning
- Authors: Elad I. Farhi and Vadim Indelman
- Abstract要約: 計画セッション全体の計算が本質的に類似しており、適切に再使用できるという重要な洞察に基づいて、新しいパラダイムであるIncremental BSPを提案します。
両手法を評価し,統計的に精度を保ちながら計算時間を大幅に削減することを示す。
- 参考スコア(独自算出の注目度): 14.62008690460147
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Deciding what's next? is a fundamental problem in robotics and Artificial
Intelligence. Under belief space planning (BSP), in a partially observable
setting, it involves calculating the expected accumulated belief-dependent
reward, where the expectation is with respect to all future measurements. Since
solving this general un-approximated problem quickly becomes intractable, state
of the art approaches turn to approximations while still calculating planning
sessions from scratch. In this work we propose a novel paradigm, Incremental
BSP (iX-BSP), based on the key insight that calculations across planning
sessions are similar in nature and can be appropriately re-used. We calculate
the expectation incrementally by utilizing Multiple Importance Sampling
techniques for selective re-sampling and re-use of measurement from previous
planning sessions. The formulation of our approach considers general
distributions and accounts for data association aspects. We demonstrate how
iX-BSP could benefit existing approximations of the general problem,
introducing iML-BSP, which re-uses calculations across planning sessions under
the common Maximum Likelihood assumption. We evaluate both methods and
demonstrate a substantial reduction in computation time while statistically
preserving accuracy. The evaluation includes both simulation and real-world
experiments considering autonomous vision-based navigation and SLAM. As a
further contribution, we introduce to iX-BSP the non-integral wildfire
approximation, allowing one to trade accuracy for computational performance by
averting from updating re-used beliefs when they are "close enough". We
evaluate iX-BSP under wildfire demonstrating a substantial reduction in
computation time while controlling the accuracy sacrifice. We also provide
analytical and empirical bounds of the effect wildfire holds over the objective
value.
- Abstract(参考訳): 次に何を決定するのか?
ロボット工学と人工知能の根本的な問題です。
信念空間計画(BSP)の下では、部分的に観測可能な環境では、予想される累積された信念に依存した報酬を計算する必要がある。
この一般的な非近似問題の解法はすぐに難解になるので、最先端の手法は計画セッションをゼロから計算しながら近似に切り替える。
本研究は,計画セッション間の計算が本質的に類似しており,適切に再利用できるというキーインサイトに基づいて,新たなパラダイムであるIncremental BSP(iX-BSP)を提案する。
複数重要度サンプリング技術を用いて、事前の計画セッションから選択的な再サンプリングと測定の再使用に期待を段階的に計算します。
本手法の定式化は,データ関連に関する一般的な分布と説明を考察する。
iML-BSPの導入により、iX-BSPが一般的な問題の既存の近似にどのように役立つかを実証します。
両手法を評価し,統計的に精度を保ちながら計算時間を大幅に削減することを示す。
この評価には、自律型ビジョンベースのナビゲーションとSLAMを考慮したシミュレーションと実世界の実験の両方が含まれる。
さらなる貢献として、iX-BSPに非積分的山火事近似を導入し、「十分近い」ときに再使用した信念の更新を回避し、計算性能の精度を取引できるようにする。
我々は,iX-BSPを山火事下で評価し,精度の犠牲を抑えながら計算時間を大幅に短縮した。
また、wildfireが客観的値に対して持つ効果の、分析的および経験的境界も提供する。
関連論文リスト
- Efficient Learning of POMDPs with Known Observation Model in Average-Reward Setting [56.92178753201331]
我々は,POMDPパラメータを信念に基づくポリシを用いて収集したサンプルから学習することのできる観測・認識スペクトル(OAS)推定手法を提案する。
提案するOAS-UCRLアルゴリズムに対して,OASプロシージャの整合性を示し,$mathcalO(sqrtT log(T)$の残差保証を証明した。
論文 参考訳(メタデータ) (2024-10-02T08:46:34Z) - Near-Optimal Learning and Planning in Separated Latent MDPs [70.88315649628251]
我々は、潜在マルコフ決定過程(LMDP)の計算的および統計的側面について研究する。
このモデルでは、学習者は、未知のMDPの混合から各エポックの開始時に描画されたMDPと相互作用する。
論文 参考訳(メタデータ) (2024-06-12T06:41:47Z) - Provably Efficient UCB-type Algorithms For Learning Predictive State
Representations [55.00359893021461]
逐次決定問題は、予測状態表現(PSR)によってモデル化された低ランク構造が認められる場合、統計的に学習可能である
本稿では,推定モデルと実モデル間の全変動距離を上限とする新しいボーナス項を特徴とする,PSRに対する最初のUCB型アプローチを提案する。
PSRに対する既存のアプローチとは対照的に、UCB型アルゴリズムは計算的トラクタビリティ、最優先の準最適ポリシー、モデルの精度が保証される。
論文 参考訳(メタデータ) (2023-07-01T18:35:21Z) - Data Association Aware POMDP Planning with Hypothesis Pruning
Performance Guarantees [7.928094304325113]
あいまいなデータアソシエーションによるプランニングのためのプルーニングに基づくアプローチを導入する。
我々の重要な貢献は、仮説の完全な集合に基づく値関数と仮説のプルーンド・サブセットに基づく値関数とのバウンダリを導出することである。
我々は,これらの境界が,ふりかえりにおけるプルーニングの証明にどのように使用できるかを実証し,その損失に対する事前定義された限界を確保するために,どの仮説がプルーンであるかを決定する新しいアプローチを提案する。
論文 参考訳(メタデータ) (2023-03-03T18:35:01Z) - Planning to the Information Horizon of BAMDPs via Epistemic State
Abstraction [27.33232096515561]
ベイズ適応マルコフ決定過程 (Bayes-Adaptive Markov Decision Process, BAMDP) は、強化学習における探索・探索のトレードオフに対するベイズ最適解を追求する形式である。
文献の多くは適切な近似アルゴリズムの開発に重点を置いている。
BAMDP計画の複雑さの尺度として,まず軽微な構造的仮定で定義する。
そして、BAMDPの複雑性を低減し、計算可能で近似的な計画アルゴリズムを生み出す可能性を備えた、特定の状態抽象化形式を導入することで、結論付ける。
論文 参考訳(メタデータ) (2022-10-30T16:30:23Z) - Planning with Dynamically Estimated Action Costs [2.8326418377665346]
実際のAI計画アプリケーションには、アクションコストに関する情報が不可欠だ。
近年のアプローチでは、データからしばしば学習されるブラックボックス外部アクションコスト推定器が計画段階で適用されている。
本稿では,行動コストを考慮した決定論的計画の一般化を提案する。
論文 参考訳(メタデータ) (2022-06-08T21:10:37Z) - Planning in Observable POMDPs in Quasipolynomial Time [21.03037504572896]
我々は観測可能なPOMDPの計画のための準ポリノミカル時間アルゴリズムを開発した。
我々は、状態上のよく分断された分布が観察上のよく分断された分布をもたらすと仮定する。
観測可能なPOMDPの指数時間仮説の下での計画に適合する硬さを実証する。
論文 参考訳(メタデータ) (2022-01-12T23:16:37Z) - Learning to Estimate Without Bias [57.82628598276623]
ガウスの定理は、重み付き最小二乗推定器は線形モデルにおける線形最小分散アンバイアスド推定(MVUE)であると述べている。
本稿では、バイアス制約のあるディープラーニングを用いて、この結果を非線形設定に拡張する第一歩を踏み出す。
BCEの第二の動機は、同じ未知の複数の推定値が平均化されてパフォーマンスが向上するアプリケーションにおいてである。
論文 参考訳(メタデータ) (2021-10-24T10:23:51Z) - Probabilistic Gradient Boosting Machines for Large-Scale Probabilistic
Regression [51.770998056563094]
PGBM(Probabilistic Gradient Boosting Machines)は、確率的予測を生成する手法である。
既存の最先端手法と比較してPGBMの利点を実証的に示す。
論文 参考訳(メタデータ) (2021-06-03T08:32:13Z) - Uncertainty-aware Remaining Useful Life predictor [57.74855412811814]
有効寿命 (Remaining Useful Life, RUL) とは、特定の産業資産の運用期間を推定する問題である。
本研究では,Deep Gaussian Processes (DGPs) を,前述の制限に対する解決策と捉える。
アルゴリズムの性能はNASAの航空機エンジン用N-CMAPSSデータセットで評価される。
論文 参考訳(メタデータ) (2021-04-08T08:50:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。