論文の概要: Observation-Augmented Contextual Multi-Armed Bandits for Robotic
Exploration with Uncertain Semantic Data
- arxiv url: http://arxiv.org/abs/2312.12583v1
- Date: Tue, 19 Dec 2023 20:28:42 GMT
- ステータス: 処理完了
- システム内更新日: 2023-12-21 17:47:33.946845
- Title: Observation-Augmented Contextual Multi-Armed Bandits for Robotic
Exploration with Uncertain Semantic Data
- Title(参考訳): 不確実なセマンティックデータを用いたロボット探査のための観測強化型マルチアーマティブバンド
- Authors: Shohei Wakayama and Nisar Ahmed
- Abstract要約: 観測拡張CMAB(OA-CMABs)と呼ばれるコンテキスト型マルチアームバンディットを新たに導入する。
OA-CMABは、コンテキスト特徴と隠れパラメータの関数として期待される選択肢の結果をモデル化する。
本稿では確率的データ検証の概念に基づくOA-CMABに対する頑健なベイズ推論プロセスを提案する。
- 参考スコア(独自算出の注目度): 7.795929277007235
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: For robotic decision-making under uncertainty, the balance between
exploitation and exploration of available options must be carefully taken into
account. In this study, we introduce a new variant of contextual multi-armed
bandits called observation-augmented CMABs (OA-CMABs) wherein a decision-making
agent can utilize extra outcome observations from an external information
source. CMABs model the expected option outcomes as a function of context
features and hidden parameters, which are inferred from previous option
outcomes. In OA-CMABs, external observations are also a function of context
features and thus provide additional evidence about the hidden parameters. Yet,
if an external information source is error-prone, the resulting posterior
updates can harm decision-making performance unless the presence of errors is
considered. To this end, we propose a robust Bayesian inference process for
OA-CMABs that is based on the concept of probabilistic data validation. Our
approach handles complex mixture model parameter priors and hybrid observation
likelihoods for semantic data sources, allowing us to develop validation
algorithms based on recently develop probabilistic semantic data association
techniques. Furthermore, to more effectively cope with the combined sources of
uncertainty in OA-CMABs, we derive a new active inference algorithm for option
selection based on expected free energy minimization. This generalizes previous
work on active inference for bandit-based robotic decision-making by accounting
for faulty observations and non-Gaussian inference. Our approaches are
demonstrated on a simulated asynchronous search site selection problem for
space exploration. The results show that even if incorrect observations are
provided by external information sources, efficient decision-making and robust
parameter inference are still achieved in a wide variety of experimental
conditions.
- Abstract(参考訳): 不確実性下でのロボットの意思決定には、搾取と利用可能な選択肢の探索のバランスを慎重に考慮しなければならない。
本研究では,外部情報ソースから得られる余分な結果の観測を意思決定エージェントが活用できる,観察増強型CMAB(OA-CMABs)と呼ばれる,コンテキスト対応型マルチアームバンディットを提案する。
CMABは、期待されるオプションの結果をコンテキスト特徴と隠れパラメータの関数としてモデル化する。
OA-CMABでは、外部観測も文脈特徴の関数であり、隠れたパラメータに関する追加の証拠を提供する。
しかし、外部情報ソースがエラーを起こしやすい場合、結果として得られた後続更新は、エラーが考慮されない限り、意思決定性能を損なう可能性がある。
この目的のために,確率的データ検証の概念に基づくOA-CMABに対する頑健なベイズ推論プロセスを提案する。
提案手法は, 複雑な混合モデルパラメータの優先順位と, 意味データソースのハイブリッド観測確率を扱い, 近年開発された確率的意味データ連想手法に基づく検証アルゴリズムの開発を可能にした。
さらに,OA-CMABにおける不確実性源の組合せをより効果的に扱うために,期待される自由エネルギー最小化に基づくオプション選択のための新しいアクティブ推論アルゴリズムを導出する。
これは、欠陥観測と非ガウス的推論を考慮し、バンディットに基づくロボット意思決定のためのアクティブ推論に関する過去の研究を一般化する。
提案手法は,宇宙探査のための非同期探索サイト選択問題をシミュレーションしたものである。
その結果, 外部情報ソースから誤った観測結果が得られても, 効率的な意思決定とロバストなパラメータ推定は, 幅広い実験条件下でも達成できることがわかった。
関連論文リスト
- Continuous Bayesian Model Selection for Multivariate Causal Discovery [22.945274948173182]
現在の因果的発見アプローチは、構造的識別可能性を確保するために、限定的なモデル仮定や介入データへのアクセスを必要とする。
近年の研究では、ベイズモデルの選択はより柔軟な仮定のために制限的モデリングを交換することで精度を大幅に向上させることができることが示されている。
合成データセットと実世界のデータセットの両方において、我々のアプローチの競争力を実証する。
論文 参考訳(メタデータ) (2024-11-15T12:55:05Z) - Unveiling the Potential of Robustness in Selecting Conditional Average Treatment Effect Estimators [19.053826145863113]
本稿では,CATE推定器選択のための分布ロバスト計量(DRM)を提案する。
DRMはニュアンスフリーであり、ニュアンスパラメータのモデルに適合する必要がなくなる。
分散的に堅牢なCATE推定器の選択を効果的に優先順位付けする。
論文 参考訳(メタデータ) (2024-02-28T15:12:24Z) - Calibrating Neural Simulation-Based Inference with Differentiable
Coverage Probability [50.44439018155837]
ニューラルモデルのトレーニング目的に直接キャリブレーション項を含めることを提案する。
古典的なキャリブレーション誤差の定式化を緩和することにより、エンドツーエンドのバックプロパゲーションを可能にする。
既存の計算パイプラインに直接適用でき、信頼性の高いブラックボックス後部推論が可能である。
論文 参考訳(メタデータ) (2023-10-20T10:20:45Z) - Causal Feature Selection via Transfer Entropy [59.999594949050596]
因果発見は、観察データによる特徴間の因果関係を特定することを目的としている。
本稿では,前向きと後向きの機能選択に依存する新たな因果的特徴選択手法を提案する。
精度および有限サンプルの場合の回帰誤差と分類誤差について理論的に保証する。
論文 参考訳(メタデータ) (2023-10-17T08:04:45Z) - Approximating Counterfactual Bounds while Fusing Observational, Biased
and Randomised Data Sources [64.96984404868411]
我々は、複数の、偏見のある、観察的、介入的な研究からのデータを統合するという問題に対処する。
利用可能なデータの可能性は局所的な最大値を持たないことを示す。
次に、同じアプローチが複数のデータセットの一般的なケースにどのように対処できるかを示す。
論文 参考訳(メタデータ) (2023-07-31T11:28:24Z) - Learning to Bound Counterfactual Inference in Structural Causal Models
from Observational and Randomised Data [64.96984404868411]
我々は、従来のEMベースのアルゴリズムを拡張するための全体的なデータの特徴付けを導出する。
新しいアルゴリズムは、そのような混合データソースからモデルパラメータの(不特定性)領域を近似することを学ぶ。
反実的な結果に間隔近似を与え、それが特定可能な場合の点に崩壊する。
論文 参考訳(メタデータ) (2022-12-06T12:42:11Z) - Rethinking Missing Data: Aleatoric Uncertainty-Aware Recommendation [59.500347564280204]
本稿では, Aleatoric Uncertainty-aware Recommendation (AUR) フレームワークを提案する。
AURは、新しい不確実性推定器と通常のレコメンデータモデルで構成されている。
誤ラベルの可能性がペアの可能性を反映しているため、AURは不確実性に応じてレコメンデーションを行う。
論文 参考訳(メタデータ) (2022-09-22T04:32:51Z) - Active Inference for Autonomous Decision-Making with Contextual
Multi-Armed Bandits [1.3670071336891754]
不確実性の下での自律的なロボット意思決定では、搾取と利用可能な選択肢の探索のトレードオフを考慮する必要がある。
本研究では,近年神経科学の分野で積極的に研究されている能動推論をCMABの代替行動選択戦略として応用する。
論文 参考訳(メタデータ) (2022-09-19T17:11:21Z) - Error-based Knockoffs Inference for Controlled Feature Selection [49.99321384855201]
本手法では, ノックオフ特徴量, エラーベース特徴重要度統計量, ステップダウン手順を一体化して, エラーベースのノックオフ推定手法を提案する。
提案手法では回帰モデルを指定する必要はなく,理論的保証で特徴選択を処理できる。
論文 参考訳(メタデータ) (2022-03-09T01:55:59Z) - On Bayesian Search for the Feasible Space Under Computationally
Expensive Constraints [0.0]
実現可能空間と実現不可能空間の境界に解が存在する確率を結合した新しい獲得関数を提案する。
実験により提案機能の有効性が確認された。
論文 参考訳(メタデータ) (2020-04-23T10:22:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。