論文の概要: involve-MI: Informative Planning with High-Dimensional Non-Parametric
Beliefs
- arxiv url: http://arxiv.org/abs/2209.11591v1
- Date: Fri, 23 Sep 2022 13:51:36 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-26 13:59:22.238984
- Title: involve-MI: Informative Planning with High-Dimensional Non-Parametric
Beliefs
- Title(参考訳): involved-MI:高次元非パラメトリックな信念による情報プランニング
- Authors: Gilad Rotman, Vadim Indelman
- Abstract要約: 我々は,情報理論的な期待報酬,相互情報(MI)を,より低次元のサブセットで計算し,効率を向上し,精度を犠牲にすることなく計算する。
次に、逐次モンテカルロ方式で機能するMIの推定器を開発し、将来の信念の表面の再構成を避ける。
この研究は、能動SLAM問題のシミュレーションで評価され、精度とタイミングの両方の改善が示される。
- 参考スコア(独自算出の注目度): 6.62472687864754
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: One of the most complex tasks of decision making and planning is to gather
information. This task becomes even more complex when the state is
high-dimensional and its belief cannot be expressed with a parametric
distribution. Although the state is high-dimensional, in many problems only a
small fraction of it might be involved in transitioning the state and
generating observations. We exploit this fact to calculate an
information-theoretic expected reward, mutual information (MI), over a much
lower-dimensional subset of the state, to improve efficiency and without
sacrificing accuracy. A similar approach was used in previous works, yet
specifically for Gaussian distributions, and we here extend it for general
distributions. Moreover, we apply the dimensionality reduction for cases in
which the new states are augmented to the previous, yet again without
sacrificing accuracy. We then continue by developing an estimator for the MI
which works in a Sequential Monte Carlo (SMC) manner, and avoids the
reconstruction of future belief's surfaces. Finally, we show how this work is
applied to the informative planning optimization problem. This work is then
evaluated in a simulation of an active SLAM problem, where the improvement in
both accuracy and timing is demonstrated.
- Abstract(参考訳): 意思決定と計画の最も複雑なタスクのひとつは、情報を集めることです。
このタスクは、状態が高次元であり、その信念がパラメトリック分布で表現できない場合にさらに複雑になる。
状態は高次元であるが、多くの問題において、状態の遷移と観測の生成に関与するのはわずかである。
この事実を利用して,情報理論的な期待報酬である相互情報(mi)を,より低次元な状態のサブセット上で計算し,効率を向上し,精度を犠牲にすることなく計算する。
同様のアプローチが以前の研究、特にガウス分布に対して用いられ、一般分布に対して拡張する。
さらに,新しい状態が以前の状態に拡張された場合でも,精度を犠牲にすることなく次元性低減を適用する。
次に、逐次モンテカルロ(SMC)方式で機能するMIの推定器を開発し、将来の信念の表面の再構築を避ける。
最後に,この作業が計画最適化問題にどのように適用されるかを示す。
本研究は, 精度とタイミングの両立が実証されたアクティブスラム問題のシミュレーションによって評価される。
関連論文リスト
- Generalizing Multi-Step Inverse Models for Representation Learning to Finite-Memory POMDPs [23.584313644411967]
本研究では,関連する情報のみを符号化し,無関係な情報を破棄する情報的,あるいはエージェント中心の状態表現の発見問題について検討する。
我々の結果は、決定論的力学設定の理論と、代替直観的アルゴリズムの反例を含む。
アルゴリズムを正しく使用した場合に成功させ、正しく使用した場合に劇的な失敗を引き起こす。
論文 参考訳(メタデータ) (2024-04-22T19:46:16Z) - Non-stationary Reinforcement Learning under General Function
Approximation [60.430936031067006]
まず,非定常MDPに対する動的ベルマンエルダー次元(DBE)と呼ばれる新しい複雑性指標を提案する。
提案する複雑性指標に基づいて,SW-OPEAと呼ばれる新しい信頼度セットに基づくモデルフリーアルゴリズムを提案する。
SW-OPEAは,変動予算がそれほど大きくない限り,有効に有効であることを示す。
論文 参考訳(メタデータ) (2023-06-01T16:19:37Z) - Extension of Dynamic Mode Decomposition for dynamic systems with
incomplete information based on t-model of optimal prediction [69.81996031777717]
動的モード分解は、動的データを研究するための非常に効率的な手法であることが証明された。
このアプローチの適用は、利用可能なデータが不完全である場合に問題となる。
本稿では,森-Zwanzig分解の1次近似を考察し,対応する最適化問題を記述し,勾配に基づく最適化法を用いて解く。
論文 参考訳(メタデータ) (2022-02-23T11:23:59Z) - Efficient Belief Space Planning in High-Dimensional State Spaces using
PIVOT: Predictive Incremental Variable Ordering Tactic [11.878820609988693]
我々は,不確実性の下でのオンライン意思決定の問題点を考察し,信頼空間における計画として定式化する。
このアプローチを PIVOT: Predictive Incremental Variable Ordering Tactic と呼ぶ。
この戦術を適用することで、状態推論の効率も向上する。
論文 参考訳(メタデータ) (2021-12-29T07:30:47Z) - Fast Approximation of the Sliced-Wasserstein Distance Using
Concentration of Random Projections [19.987683989865708]
Sliced-Wasserstein distance (SW) は、機械学習アプリケーションでますます使われている。
本稿では,測度現象の集中を利用してSWを近似する新しい視点を提案する。
提案手法は多数のランダムなプロジェクションをサンプリングする必要はなく,通常のモンテカルロ近似と比較して正確かつ容易に利用できる。
論文 参考訳(メタデータ) (2021-06-29T13:56:19Z) - Parallel Stochastic Mirror Descent for MDPs [72.75921150912556]
無限水平マルコフ決定過程(MDP)における最適政策学習の問題を考える。
リプシッツ連続関数を用いた凸プログラミング問題に対してミラー・ディクセントの変種が提案されている。
このアルゴリズムを一般の場合において解析し,提案手法の動作中に誤差を蓄積しない収束率の推定値を得る。
論文 参考訳(メタデータ) (2021-02-27T19:28:39Z) - Neural Joint Entropy Estimation [12.77733789371855]
離散確率変数のエントロピーの推定は情報理論と関連する分野における根本的な問題である。
本稿では,McAllester と Statos (2020) の業績を拡張した,この問題に対する実用的な解決策を提案する。
提案手法は,深層ニューラルネットワーク(DNN)におけるクロスエントロピー推定の一般化能力を用いて,エントロピー推定精度の向上を図る。
論文 参考訳(メタデータ) (2020-12-21T09:23:39Z) - Augmented Parallel-Pyramid Net for Attention Guided Pose-Estimation [90.28365183660438]
本稿では、注意部分モジュールと微分可能な自動データ拡張を備えた拡張並列ピラミドネットを提案する。
我々は、データ拡張のシーケンスをトレーニング可能なCNNコンポーネントとして定式化する新しいポーズ検索空間を定義する。
特に,本手法は,挑戦的なCOCOキーポイントベンチマークとMPIIデータセットの最先端結果において,トップ1の精度を実現する。
論文 参考訳(メタデータ) (2020-03-17T03:52:17Z) - Approximate MMAP by Marginal Search [78.50747042819503]
本稿では,グラフィカルモデルにおける最小値MAPクエリの戦略を提案する。
提案した信頼度尺度は,アルゴリズムが正確であるインスタンスを適切に検出するものである。
十分に高い信頼度を得るために、アルゴリズムは正確な解を与えるか、正確な解からハミング距離が小さい近似を与える。
論文 参考訳(メタデータ) (2020-02-12T07:41:13Z) - A Near-Optimal Gradient Flow for Learning Neural Energy-Based Models [93.24030378630175]
学習エネルギーベースモデル(EBM)の勾配流を最適化する新しい数値スキームを提案する。
フォッカー・プランク方程式から大域相対エントロピーの2階ワッサーシュタイン勾配流を導出する。
既存のスキームと比較して、ワッサーシュタイン勾配流は実データ密度を近似するより滑らかで近似的な数値スキームである。
論文 参考訳(メタデータ) (2019-10-31T02:26:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。