論文の概要: Observation-Augmented Contextual Multi-Armed Bandits for Robotic
Exploration with Uncertain Semantic Data
- arxiv url: http://arxiv.org/abs/2312.12583v1
- Date: Tue, 19 Dec 2023 20:28:42 GMT
- ステータス: 処理完了
- システム内更新日: 2023-12-21 17:47:33.946845
- Title: Observation-Augmented Contextual Multi-Armed Bandits for Robotic
Exploration with Uncertain Semantic Data
- Title(参考訳): 不確実なセマンティックデータを用いたロボット探査のための観測強化型マルチアーマティブバンド
- Authors: Shohei Wakayama and Nisar Ahmed
- Abstract要約: 観測拡張CMAB(OA-CMABs)と呼ばれるコンテキスト型マルチアームバンディットを新たに導入する。
OA-CMABは、コンテキスト特徴と隠れパラメータの関数として期待される選択肢の結果をモデル化する。
本稿では確率的データ検証の概念に基づくOA-CMABに対する頑健なベイズ推論プロセスを提案する。
- 参考スコア(独自算出の注目度): 7.795929277007235
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: For robotic decision-making under uncertainty, the balance between
exploitation and exploration of available options must be carefully taken into
account. In this study, we introduce a new variant of contextual multi-armed
bandits called observation-augmented CMABs (OA-CMABs) wherein a decision-making
agent can utilize extra outcome observations from an external information
source. CMABs model the expected option outcomes as a function of context
features and hidden parameters, which are inferred from previous option
outcomes. In OA-CMABs, external observations are also a function of context
features and thus provide additional evidence about the hidden parameters. Yet,
if an external information source is error-prone, the resulting posterior
updates can harm decision-making performance unless the presence of errors is
considered. To this end, we propose a robust Bayesian inference process for
OA-CMABs that is based on the concept of probabilistic data validation. Our
approach handles complex mixture model parameter priors and hybrid observation
likelihoods for semantic data sources, allowing us to develop validation
algorithms based on recently develop probabilistic semantic data association
techniques. Furthermore, to more effectively cope with the combined sources of
uncertainty in OA-CMABs, we derive a new active inference algorithm for option
selection based on expected free energy minimization. This generalizes previous
work on active inference for bandit-based robotic decision-making by accounting
for faulty observations and non-Gaussian inference. Our approaches are
demonstrated on a simulated asynchronous search site selection problem for
space exploration. The results show that even if incorrect observations are
provided by external information sources, efficient decision-making and robust
parameter inference are still achieved in a wide variety of experimental
conditions.
- Abstract(参考訳): 不確実性下でのロボットの意思決定には、搾取と利用可能な選択肢の探索のバランスを慎重に考慮しなければならない。
本研究では,外部情報ソースから得られる余分な結果の観測を意思決定エージェントが活用できる,観察増強型CMAB(OA-CMABs)と呼ばれる,コンテキスト対応型マルチアームバンディットを提案する。
CMABは、期待されるオプションの結果をコンテキスト特徴と隠れパラメータの関数としてモデル化する。
OA-CMABでは、外部観測も文脈特徴の関数であり、隠れたパラメータに関する追加の証拠を提供する。
しかし、外部情報ソースがエラーを起こしやすい場合、結果として得られた後続更新は、エラーが考慮されない限り、意思決定性能を損なう可能性がある。
この目的のために,確率的データ検証の概念に基づくOA-CMABに対する頑健なベイズ推論プロセスを提案する。
提案手法は, 複雑な混合モデルパラメータの優先順位と, 意味データソースのハイブリッド観測確率を扱い, 近年開発された確率的意味データ連想手法に基づく検証アルゴリズムの開発を可能にした。
さらに,OA-CMABにおける不確実性源の組合せをより効果的に扱うために,期待される自由エネルギー最小化に基づくオプション選択のための新しいアクティブ推論アルゴリズムを導出する。
これは、欠陥観測と非ガウス的推論を考慮し、バンディットに基づくロボット意思決定のためのアクティブ推論に関する過去の研究を一般化する。
提案手法は,宇宙探査のための非同期探索サイト選択問題をシミュレーションしたものである。
その結果, 外部情報ソースから誤った観測結果が得られても, 効率的な意思決定とロバストなパラメータ推定は, 幅広い実験条件下でも達成できることがわかった。
関連論文リスト
- Assumption-Lean Post-Integrated Inference with Negative Control Outcomes [0.0]
負の制御結果を用いて遅延不均一性を調整する頑健なポストインテグレート推論(PII)手法を提案する。
提案手法は,予測された直接効果推定値,隠された仲介者,共同設立者,モデレーターまで拡張する。
提案された二重頑健な推定器は、最小の仮定と潜在的な不特定性の下で一貫性があり、効率的である。
論文 参考訳(メタデータ) (2024-10-07T12:52:38Z) - Bounded and Unbiased Composite Differential Privacy [25.427802467876248]
差分プライバシ(DP)の目的は、隣接する2つのデータベース間で区別できない出力分布を生成することにより、プライバシを保護することである。
既存のソリューションでは、後処理やトランケーション技術を使ってこの問題に対処しようとしている。
本稿では,合成確率密度関数を用いて有界および非偏りの出力を生成する新しい微分プライベート機構を提案する。
論文 参考訳(メタデータ) (2023-11-04T04:43:47Z) - Approximating Counterfactual Bounds while Fusing Observational, Biased
and Randomised Data Sources [64.96984404868411]
我々は、複数の、偏見のある、観察的、介入的な研究からのデータを統合するという問題に対処する。
利用可能なデータの可能性は局所的な最大値を持たないことを示す。
次に、同じアプローチが複数のデータセットの一般的なケースにどのように対処できるかを示す。
論文 参考訳(メタデータ) (2023-07-31T11:28:24Z) - ALMERIA: Boosting pairwise molecular contrasts with scalable methods [0.0]
ALMERIAは、一対の分子コントラストに基づく化合物の類似性と活性予測を推定するためのツールである。
大量のデータを利用するスケーラブルなソフトウェアと手法を使って実装されている。
分子活性予測の最先端性能を示す実験を行った。
論文 参考訳(メタデータ) (2023-04-28T16:27:06Z) - Learning to Bound Counterfactual Inference in Structural Causal Models
from Observational and Randomised Data [64.96984404868411]
我々は、従来のEMベースのアルゴリズムを拡張するための全体的なデータの特徴付けを導出する。
新しいアルゴリズムは、そのような混合データソースからモデルパラメータの(不特定性)領域を近似することを学ぶ。
反実的な結果に間隔近似を与え、それが特定可能な場合の点に崩壊する。
論文 参考訳(メタデータ) (2022-12-06T12:42:11Z) - MissDAG: Causal Discovery in the Presence of Missing Data with
Continuous Additive Noise Models [78.72682320019737]
不完全な観測データから因果発見を行うため,MissDAGと呼ばれる一般的な手法を開発した。
MissDAGは、期待-最大化の枠組みの下で観測の可視部分の期待される可能性を最大化する。
各種因果探索アルゴリズムを組み込んだMissDAGの柔軟性について,広範囲なシミュレーションと実データ実験により検証した。
論文 参考訳(メタデータ) (2022-05-27T09:59:46Z) - The interventional Bayesian Gaussian equivalent score for Bayesian
causal inference with unknown soft interventions [0.0]
ゲノミクスのような特定の環境では、不均一な研究条件からのデータがあり、研究変数のサブセットのみに関連するソフトな(部分的な)介入がある。
観察データと介入データとの混合に対する介入BGeスコアを定義し,介入の目的と効果が不明である可能性がある。
論文 参考訳(メタデータ) (2022-05-05T12:32:08Z) - Leveraging Global Parameters for Flow-based Neural Posterior Estimation [90.21090932619695]
実験観測に基づくモデルのパラメータを推定することは、科学的方法の中心である。
特に困難な設定は、モデルが強く不確定であるとき、すなわち、パラメータの異なるセットが同一の観測をもたらすときである。
本稿では,グローバルパラメータを共有する観測の補助的セットによって伝達される付加情報を利用して,その不確定性を破る手法を提案する。
論文 参考訳(メタデータ) (2021-02-12T12:23:13Z) - Decorrelated Clustering with Data Selection Bias [55.91842043124102]
本稿では,データ選択バイアスを伴うクラスタリングのためのデコリレーション正規化K-Meansアルゴリズム(DCKM)を提案する。
DCKMアルゴリズムは,選択バイアスによって生じる予期せぬ特徴相関を除去する必要があることを示す。
論文 参考訳(メタデータ) (2020-06-29T08:55:50Z) - A Robust Functional EM Algorithm for Incomplete Panel Count Data [66.07942227228014]
完全無作為な仮定(MCAR)の下での数え上げ過程の平均関数を推定する機能的EMアルゴリズムを提案する。
提案アルゴリズムは、いくつかの一般的なパネル数推定手法をラップし、不完全数にシームレスに対処し、ポアソン過程の仮定の誤特定に頑健である。
本稿では, 数値実験による提案アルゴリズムの有用性と喫煙停止データの解析について述べる。
論文 参考訳(メタデータ) (2020-03-02T20:04:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。