論文の概要: Observation-Augmented Contextual Multi-Armed Bandits for Robotic Search and Exploration
- arxiv url: http://arxiv.org/abs/2312.12583v2
- Date: Sun, 05 Jan 2025 16:52:37 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-01-07 17:02:15.629662
- Title: Observation-Augmented Contextual Multi-Armed Bandits for Robotic Search and Exploration
- Title(参考訳): ロボットによる探索・探索のための観測強化されたコンテキスト多元帯域
- Authors: Shohei Wakayama, Nisar Ahmed,
- Abstract要約: 我々は、観測増強CMAB(OA-CMAB)と呼ばれるコンテキスト多重武装バンディット(CMAB)の新たな変種を導入する。
OA-CMABでは、外部観測は文脈特徴の関数であり、観測結果の上に隠れパラメータを推測する証拠を提供する。
我々は最近開発された確率論的セマンティック・アソシエーション技術に基づいて,OA-CMABに対する頑健なベイズ推定過程を導出する。
- 参考スコア(独自算出の注目度): 6.5990719141691825
- License:
- Abstract: We introduce a new variant of contextual multi-armed bandits (CMABs) called observation-augmented CMABs (OA-CMABs) wherein a robot uses extra outcome observations from an external information source, e.g. humans. In OA-CMABs, external observations are a function of context features and thus provide evidence on top of observed option outcomes to infer hidden parameters. However, if external data is error-prone, measures must be taken to preserve the correctness of inference. To this end, we derive a robust Bayesian inference process for OA-CMABs based on recently developed probabilistic semantic data association techniques, which handle complex mixture model parameter priors and hybrid discrete-continuous observation likelihoods for semantic external data sources. To cope with combined uncertainties in OA-CMABs, we also derive a new active inference algorithm for optimal option selection based on approximate expected free energy minimization. This generalizes prior work on CMAB active inference by accounting for faulty observations and non-Gaussian distributions. Results for a simulated deep space search site selection problem show that, even if incorrect semantic observations are provided externally, e.g. by scientists, efficient decision-making and robust parameter inference are still achieved in a wide variety of conditions.
- Abstract(参考訳): 我々は,外部情報ソース,例えば人間からの余分な結果観測をロボットが利用する,観察増強型CMAB(OA-CMABs)と呼ばれる,コンテキスト型マルチアームバンディット(CMABs)を新たに導入する。
OA-CMABでは、外部観測は文脈特徴の関数であり、隠れたパラメータを推測する観測結果の上に証拠を与える。
しかし、外部データがエラーを起こしやすい場合は、推論の正確性を維持するための措置を取らなければならない。
この目的のために, 複雑な混合モデルパラメータの先行処理と, セマンティック外部データソースに対するハイブリッド離散連続観測確率を取り扱う確率論的セマンティックデータアソシエーション技術に基づいて, OA-CMABに対するロバストなベイズ推定過程を導出する。
OA-CMABの組合せ不確実性に対処するため、近似自由エネルギー最小化に基づく最適オプション選択のための新しい能動推論アルゴリズムを導出する。
これは、欠陥観測と非ガウス分布を考慮し、CMABのアクティブ推論に関する先行研究を一般化する。
シミュレーションされた深宇宙探索サイト選択問題の結果は、たとえ誤った意味的観察が外部に提供されたとしても、例えば科学者によって、効率的な意思決定と堅牢なパラメータ推論は、まだ様々な条件下で達成されていることを示している。
関連論文リスト
- Assumption-Lean Post-Integrated Inference with Negative Control Outcomes [0.0]
負の制御結果を用いて遅延不均一性を調整する頑健なポストインテグレート推論(PII)手法を提案する。
提案手法は,予測された直接効果推定値,隠された仲介者,共同設立者,モデレーターまで拡張する。
提案された二重頑健な推定器は、最小の仮定と潜在的な不特定性の下で一貫性があり、効率的である。
論文 参考訳(メタデータ) (2024-10-07T12:52:38Z) - Bounded and Unbiased Composite Differential Privacy [25.427802467876248]
差分プライバシ(DP)の目的は、隣接する2つのデータベース間で区別できない出力分布を生成することにより、プライバシを保護することである。
既存のソリューションでは、後処理やトランケーション技術を使ってこの問題に対処しようとしている。
本稿では,合成確率密度関数を用いて有界および非偏りの出力を生成する新しい微分プライベート機構を提案する。
論文 参考訳(メタデータ) (2023-11-04T04:43:47Z) - Approximating Counterfactual Bounds while Fusing Observational, Biased
and Randomised Data Sources [64.96984404868411]
我々は、複数の、偏見のある、観察的、介入的な研究からのデータを統合するという問題に対処する。
利用可能なデータの可能性は局所的な最大値を持たないことを示す。
次に、同じアプローチが複数のデータセットの一般的なケースにどのように対処できるかを示す。
論文 参考訳(メタデータ) (2023-07-31T11:28:24Z) - ALMERIA: Boosting pairwise molecular contrasts with scalable methods [0.0]
ALMERIAは、一対の分子コントラストに基づく化合物の類似性と活性予測を推定するためのツールである。
大量のデータを利用するスケーラブルなソフトウェアと手法を使って実装されている。
分子活性予測の最先端性能を示す実験を行った。
論文 参考訳(メタデータ) (2023-04-28T16:27:06Z) - Learning to Bound Counterfactual Inference in Structural Causal Models
from Observational and Randomised Data [64.96984404868411]
我々は、従来のEMベースのアルゴリズムを拡張するための全体的なデータの特徴付けを導出する。
新しいアルゴリズムは、そのような混合データソースからモデルパラメータの(不特定性)領域を近似することを学ぶ。
反実的な結果に間隔近似を与え、それが特定可能な場合の点に崩壊する。
論文 参考訳(メタデータ) (2022-12-06T12:42:11Z) - MissDAG: Causal Discovery in the Presence of Missing Data with
Continuous Additive Noise Models [78.72682320019737]
不完全な観測データから因果発見を行うため,MissDAGと呼ばれる一般的な手法を開発した。
MissDAGは、期待-最大化の枠組みの下で観測の可視部分の期待される可能性を最大化する。
各種因果探索アルゴリズムを組み込んだMissDAGの柔軟性について,広範囲なシミュレーションと実データ実験により検証した。
論文 参考訳(メタデータ) (2022-05-27T09:59:46Z) - The interventional Bayesian Gaussian equivalent score for Bayesian
causal inference with unknown soft interventions [0.0]
ゲノミクスのような特定の環境では、不均一な研究条件からのデータがあり、研究変数のサブセットのみに関連するソフトな(部分的な)介入がある。
観察データと介入データとの混合に対する介入BGeスコアを定義し,介入の目的と効果が不明である可能性がある。
論文 参考訳(メタデータ) (2022-05-05T12:32:08Z) - Leveraging Global Parameters for Flow-based Neural Posterior Estimation [90.21090932619695]
実験観測に基づくモデルのパラメータを推定することは、科学的方法の中心である。
特に困難な設定は、モデルが強く不確定であるとき、すなわち、パラメータの異なるセットが同一の観測をもたらすときである。
本稿では,グローバルパラメータを共有する観測の補助的セットによって伝達される付加情報を利用して,その不確定性を破る手法を提案する。
論文 参考訳(メタデータ) (2021-02-12T12:23:13Z) - Decorrelated Clustering with Data Selection Bias [55.91842043124102]
本稿では,データ選択バイアスを伴うクラスタリングのためのデコリレーション正規化K-Meansアルゴリズム(DCKM)を提案する。
DCKMアルゴリズムは,選択バイアスによって生じる予期せぬ特徴相関を除去する必要があることを示す。
論文 参考訳(メタデータ) (2020-06-29T08:55:50Z) - A Robust Functional EM Algorithm for Incomplete Panel Count Data [66.07942227228014]
完全無作為な仮定(MCAR)の下での数え上げ過程の平均関数を推定する機能的EMアルゴリズムを提案する。
提案アルゴリズムは、いくつかの一般的なパネル数推定手法をラップし、不完全数にシームレスに対処し、ポアソン過程の仮定の誤特定に頑健である。
本稿では, 数値実験による提案アルゴリズムの有用性と喫煙停止データの解析について述べる。
論文 参考訳(メタデータ) (2020-03-02T20:04:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。