論文の概要: Data Association Aware POMDP Planning with Hypothesis Pruning
Performance Guarantees
- arxiv url: http://arxiv.org/abs/2303.02139v3
- Date: Tue, 1 Aug 2023 18:41:35 GMT
- ステータス: 処理完了
- システム内更新日: 2023-08-03 17:53:47.277538
- Title: Data Association Aware POMDP Planning with Hypothesis Pruning
Performance Guarantees
- Title(参考訳): 仮説プラニング性能保証によるpomdp計画を考慮したデータアソシエーション
- Authors: Moran Barenboim, Idan Lev-Yehudi and Vadim Indelman
- Abstract要約: あいまいなデータアソシエーションによるプランニングのためのプルーニングに基づくアプローチを導入する。
我々の重要な貢献は、仮説の完全な集合に基づく値関数と仮説のプルーンド・サブセットに基づく値関数とのバウンダリを導出することである。
我々は,これらの境界が,ふりかえりにおけるプルーニングの証明にどのように使用できるかを実証し,その損失に対する事前定義された限界を確保するために,どの仮説がプルーンであるかを決定する新しいアプローチを提案する。
- 参考スコア(独自算出の注目度): 7.928094304325113
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Autonomous agents that operate in the real world must often deal with partial
observability, which is commonly modeled as partially observable Markov
decision processes (POMDPs). However, traditional POMDP models rely on the
assumption of complete knowledge of the observation source, known as fully
observable data association. To address this limitation, we propose a planning
algorithm that maintains multiple data association hypotheses, represented as a
belief mixture, where each component corresponds to a different data
association hypothesis. However, this method can lead to an exponential growth
in the number of hypotheses, resulting in significant computational overhead.
To overcome this challenge, we introduce a pruning-based approach for planning
with ambiguous data associations. Our key contribution is to derive bounds
between the value function based on the complete set of hypotheses and the
value function based on a pruned-subset of the hypotheses, enabling us to
establish a trade-off between computational efficiency and performance. We
demonstrate how these bounds can both be used to certify any pruning heuristic
in retrospect and propose a novel approach to determine which hypotheses to
prune in order to ensure a predefined limit on the loss. We evaluate our
approach in simulated environments and demonstrate its efficacy in handling
multi-modal belief hypotheses with ambiguous data associations.
- Abstract(参考訳): 現実世界で活動する自律エージェントは、部分的に観測可能なマルコフ決定プロセス(POMDP)としてモデル化される部分観測可能性を扱う必要がある。
しかし、従来のPOMDPモデルは、完全に観測可能なデータアソシエーションとして知られる観測源の完全な知識の仮定に依存している。
この制限に対処するために、各コンポーネントが異なるデータアソシエーション仮説に対応する信念混合として表される複数のデータアソシエーション仮説を維持する計画アルゴリズムを提案する。
しかし、この方法では仮説の数が指数関数的に増加し、計算オーバーヘッドが大きくなる可能性がある。
この課題を克服するため,我々は,あいまいなデータアソシエーションを用いたプランニング手法を提案する。
我々の重要な貢献は、仮説の完全な集合に基づく値関数と仮説のプルーニングされた部分集合に基づく値関数の境界を導出することであり、計算効率と性能のトレードオフを確立することができる。
これらの境界を遡及的に刈り取るヒューリスティックの証明に利用できることを実証し、損失に対する事前定義された限界を確保するために、どの仮説をプルーンにするかを決定する新しいアプローチを提案する。
シミュレーション環境でのアプローチを評価し,曖昧なデータ関連を持つマルチモーダル信念の処理におけるその効果を実証する。
関連論文リスト
- Stratified Prediction-Powered Inference for Hybrid Language Model Evaluation [62.2436697657307]
予測駆動推論(英: Prediction-powered Inference, PPI)は、人間ラベル付き限られたデータに基づいて統計的推定を改善する手法である。
我々はStratPPI(Stratified Prediction-Powered Inference)という手法を提案する。
単純なデータ階層化戦略を用いることで,基礎的なPPI推定精度を大幅に向上できることを示す。
論文 参考訳(メタデータ) (2024-06-06T17:37:39Z) - Deriving Causal Order from Single-Variable Interventions: Guarantees & Algorithm [14.980926991441345]
介入データを含むデータセットは,データ分布に関する現実的な仮定の下で効果的に抽出可能であることを示す。
観察的および介入的設定における各変数の限界分布の比較に依拠する介入忠実性を導入する。
また、多数の単一変数の介入を含むデータセットから因果順序を推測するアルゴリズムであるIntersortを導入する。
論文 参考訳(メタデータ) (2024-05-28T16:07:17Z) - Conformal Counterfactual Inference under Hidden Confounding [19.190396053530417]
反ファクトの世界における潜在的な結果の予測と不確実性は、因果推論における因果的問題を引き起こす。
反事実に対する信頼区間を構成する既存の方法は、強い無知の仮定に依存する。
提案手法は, 限界収束保証付き実測結果に対する信頼区間を提供するトランスダクティブ重み付き共形予測に基づく新しい手法を提案する。
論文 参考訳(メタデータ) (2024-05-20T21:43:43Z) - Mitigating LLM Hallucinations via Conformal Abstention [70.83870602967625]
我々は,大言語モデルが一般ドメインでの応答をいつ無視すべきかを決定するための,原則化された手順を開発する。
我々は、幻覚率(エラー率)の厳密な理論的保証の恩恵を受けるため、共形予測手法を活用して、禁忌手順を開発する。
実験によって得られた共形禁忌法は, 種々の閉書, オープンドメイン生成質問応答データセットに, 幻覚率を確実に拘束する。
論文 参考訳(メタデータ) (2024-04-04T11:32:03Z) - Source-Free Unsupervised Domain Adaptation with Hypothesis Consolidation
of Prediction Rationale [53.152460508207184]
Source-Free Unsupervised Domain Adaptation (SFUDA)は、モデルがターゲットのドメインラベルやソースドメインデータにアクセスせずに新しいドメインに適応する必要がある、という課題である。
本稿では,各サンプルについて複数の予測仮説を考察し,各仮説の背景にある理論的根拠について考察する。
最適性能を達成するために,モデル事前適応,仮説統合,半教師付き学習という3段階の適応プロセスを提案する。
論文 参考訳(メタデータ) (2024-02-02T05:53:22Z) - Efficient Conformal Prediction under Data Heterogeneity [79.35418041861327]
コンフォーマル予測(CP)は不確実性定量化のための頑健な枠組みである。
非交換性に対処するための既存のアプローチは、最も単純な例を超えて計算不可能なメソッドにつながる。
この研究は、比較的一般的な非交換可能なデータ分布に対して証明可能な信頼セットを生成する、CPに新しい効率的なアプローチを導入する。
論文 参考訳(メタデータ) (2023-12-25T20:02:51Z) - Advancing Counterfactual Inference through Nonlinear Quantile Regression [77.28323341329461]
ニューラルネットワークで実装された効率的かつ効果的な対実的推論のためのフレームワークを提案する。
提案手法は、推定された反事実結果から見つからないデータまでを一般化する能力を高める。
複数のデータセットで実施した実証実験の結果は、我々の理論的な主張に対する説得力のある支持を提供する。
論文 参考訳(メタデータ) (2023-06-09T08:30:51Z) - Counterfactual inference for sequential experiments [17.817769460838665]
複数の単位に複数の時間点に対する処理を割り当てるシーケンシャルな設計実験のアフタースタディ統計的推測を考察する。
我々のゴールは、最小限のスケールで、カウンターファクト平均に対する推論保証を提供することです。
我々は,いくつかのシミュレーションと,モバイル医療臨床試験HeartStepsのデータを含むケーススタディを通して,我々の理論を解説する。
論文 参考訳(メタデータ) (2022-02-14T17:24:27Z) - D2A-BSP: Distilled Data Association Belief Space Planning with
Performance Guarantees Under Budget Constraints [6.62472687864754]
不明瞭で知覚的な環境における未解決のデータアソシエーションは、ロボットの環境状態と環境状態の両方にマルチモーダル仮説をもたらす。
そこで本研究では,BSP問題の解法として,蒸留された仮説のサブセットのみを利用する新しい手法を提案する。
そこで我々は,解の質を損なうことなく,計算時間を著しく短縮する手法を提案する。
論文 参考訳(メタデータ) (2022-02-10T11:13:24Z) - GenDICE: Generalized Offline Estimation of Stationary Values [108.17309783125398]
重要なアプリケーションでは,効果的な推定が依然として可能であることを示す。
我々のアプローチは、定常分布と経験分布の差を補正する比率を推定することに基づいている。
結果として得られるアルゴリズム、GenDICEは単純で効果的である。
論文 参考訳(メタデータ) (2020-02-21T00:27:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。