論文の概要: Observation-Augmented Contextual Multi-Armed Bandits for Robotic Search and Exploration
- arxiv url: http://arxiv.org/abs/2312.12583v2
- Date: Sun, 05 Jan 2025 16:52:37 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-01-07 16:36:49.18108
- Title: Observation-Augmented Contextual Multi-Armed Bandits for Robotic Search and Exploration
- Title(参考訳): ロボットによる探索・探索のための観測強化されたコンテキスト多元帯域
- Authors: Shohei Wakayama, Nisar Ahmed,
- Abstract要約: 我々は、観測増強CMAB(OA-CMAB)と呼ばれるコンテキスト多重武装バンディット(CMAB)の新たな変種を導入する。
OA-CMABでは、外部観測は文脈特徴の関数であり、観測結果の上に隠れパラメータを推測する証拠を提供する。
我々は最近開発された確率論的セマンティック・アソシエーション技術に基づいて,OA-CMABに対する頑健なベイズ推定過程を導出する。
- 参考スコア(独自算出の注目度): 6.5990719141691825
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We introduce a new variant of contextual multi-armed bandits (CMABs) called observation-augmented CMABs (OA-CMABs) wherein a robot uses extra outcome observations from an external information source, e.g. humans. In OA-CMABs, external observations are a function of context features and thus provide evidence on top of observed option outcomes to infer hidden parameters. However, if external data is error-prone, measures must be taken to preserve the correctness of inference. To this end, we derive a robust Bayesian inference process for OA-CMABs based on recently developed probabilistic semantic data association techniques, which handle complex mixture model parameter priors and hybrid discrete-continuous observation likelihoods for semantic external data sources. To cope with combined uncertainties in OA-CMABs, we also derive a new active inference algorithm for optimal option selection based on approximate expected free energy minimization. This generalizes prior work on CMAB active inference by accounting for faulty observations and non-Gaussian distributions. Results for a simulated deep space search site selection problem show that, even if incorrect semantic observations are provided externally, e.g. by scientists, efficient decision-making and robust parameter inference are still achieved in a wide variety of conditions.
- Abstract(参考訳): 我々は,外部情報ソース,例えば人間からの余分な結果観測をロボットが利用する,観察増強型CMAB(OA-CMABs)と呼ばれる,コンテキスト型マルチアームバンディット(CMABs)を新たに導入する。
OA-CMABでは、外部観測は文脈特徴の関数であり、隠れたパラメータを推測する観測結果の上に証拠を与える。
しかし、外部データがエラーを起こしやすい場合は、推論の正確性を維持するための措置を取らなければならない。
この目的のために, 複雑な混合モデルパラメータの先行処理と, セマンティック外部データソースに対するハイブリッド離散連続観測確率を取り扱う確率論的セマンティックデータアソシエーション技術に基づいて, OA-CMABに対するロバストなベイズ推定過程を導出する。
OA-CMABの組合せ不確実性に対処するため、近似自由エネルギー最小化に基づく最適オプション選択のための新しい能動推論アルゴリズムを導出する。
これは、欠陥観測と非ガウス分布を考慮し、CMABのアクティブ推論に関する先行研究を一般化する。
シミュレーションされた深宇宙探索サイト選択問題の結果は、たとえ誤った意味的観察が外部に提供されたとしても、例えば科学者によって、効率的な意思決定と堅牢なパラメータ推論は、まだ様々な条件下で達成されていることを示している。
関連論文リスト
- Robust and Scalable Variational Bayes [2.014089835498735]
本稿では,大規模なデータセットにおいて,外れ値や任意の性質の汚染を効果的に処理する変動ベイズ(VB)のための頑健なフレームワークを提案する。
提案手法では,データセットを解離部分集合に分割し,各部分集合の後方を計算し,これらの部分集合に独立してVB近似を適用する。
この新しいアグリゲーション法は、変分媒介後(VM-Posterior)分布を生成する。
論文 参考訳(メタデータ) (2025-04-16T23:20:43Z) - Continuous Bayesian Model Selection for Multivariate Causal Discovery [22.945274948173182]
現在の因果的発見アプローチは、構造的識別可能性を確保するために、限定的なモデル仮定や介入データへのアクセスを必要とする。
近年の研究では、ベイズモデルの選択はより柔軟な仮定のために制限的モデリングを交換することで精度を大幅に向上させることができることが示されている。
合成データセットと実世界のデータセットの両方において、我々のアプローチの競争力を実証する。
論文 参考訳(メタデータ) (2024-11-15T12:55:05Z) - Assumption-Lean Post-Integrated Inference with Negative Control Outcomes [0.0]
負の制御結果を用いて遅延不均一性を調整する頑健なポストインテグレート推論(PII)手法を提案する。
提案手法は,予測された直接効果推定値,隠された仲介者,共同設立者,モデレーターまで拡張する。
提案された二重頑健な推定器は、最小の仮定と潜在的な不特定性の下で一貫性があり、効率的である。
論文 参考訳(メタデータ) (2024-10-07T12:52:38Z) - Unveiling the Potential of Robustness in Selecting Conditional Average Treatment Effect Estimators [19.053826145863113]
本稿では,CATE推定器選択のための分布ロバスト計量(DRM)を提案する。
DRMはニュアンスフリーであり、ニュアンスパラメータのモデルに適合する必要がなくなる。
分散的に堅牢なCATE推定器の選択を効果的に優先順位付けする。
論文 参考訳(メタデータ) (2024-02-28T15:12:24Z) - Calibrating Neural Simulation-Based Inference with Differentiable
Coverage Probability [50.44439018155837]
ニューラルモデルのトレーニング目的に直接キャリブレーション項を含めることを提案する。
古典的なキャリブレーション誤差の定式化を緩和することにより、エンドツーエンドのバックプロパゲーションを可能にする。
既存の計算パイプラインに直接適用でき、信頼性の高いブラックボックス後部推論が可能である。
論文 参考訳(メタデータ) (2023-10-20T10:20:45Z) - Causal Feature Selection via Transfer Entropy [59.999594949050596]
因果発見は、観察データによる特徴間の因果関係を特定することを目的としている。
本稿では,前向きと後向きの機能選択に依存する新たな因果的特徴選択手法を提案する。
精度および有限サンプルの場合の回帰誤差と分類誤差について理論的に保証する。
論文 参考訳(メタデータ) (2023-10-17T08:04:45Z) - Approximating Counterfactual Bounds while Fusing Observational, Biased
and Randomised Data Sources [64.96984404868411]
我々は、複数の、偏見のある、観察的、介入的な研究からのデータを統合するという問題に対処する。
利用可能なデータの可能性は局所的な最大値を持たないことを示す。
次に、同じアプローチが複数のデータセットの一般的なケースにどのように対処できるかを示す。
論文 参考訳(メタデータ) (2023-07-31T11:28:24Z) - ALMERIA: Boosting pairwise molecular contrasts with scalable methods [0.0]
ALMERIAは、一対の分子コントラストに基づく化合物の類似性と活性予測を推定するためのツールである。
大量のデータを利用するスケーラブルなソフトウェアと手法を使って実装されている。
分子活性予測の最先端性能を示す実験を行った。
論文 参考訳(メタデータ) (2023-04-28T16:27:06Z) - Learning to Bound Counterfactual Inference in Structural Causal Models
from Observational and Randomised Data [64.96984404868411]
我々は、従来のEMベースのアルゴリズムを拡張するための全体的なデータの特徴付けを導出する。
新しいアルゴリズムは、そのような混合データソースからモデルパラメータの(不特定性)領域を近似することを学ぶ。
反実的な結果に間隔近似を与え、それが特定可能な場合の点に崩壊する。
論文 参考訳(メタデータ) (2022-12-06T12:42:11Z) - Rethinking Missing Data: Aleatoric Uncertainty-Aware Recommendation [59.500347564280204]
本稿では, Aleatoric Uncertainty-aware Recommendation (AUR) フレームワークを提案する。
AURは、新しい不確実性推定器と通常のレコメンデータモデルで構成されている。
誤ラベルの可能性がペアの可能性を反映しているため、AURは不確実性に応じてレコメンデーションを行う。
論文 参考訳(メタデータ) (2022-09-22T04:32:51Z) - Active Inference for Autonomous Decision-Making with Contextual
Multi-Armed Bandits [1.3670071336891754]
不確実性の下での自律的なロボット意思決定では、搾取と利用可能な選択肢の探索のトレードオフを考慮する必要がある。
本研究では,近年神経科学の分野で積極的に研究されている能動推論をCMABの代替行動選択戦略として応用する。
論文 参考訳(メタデータ) (2022-09-19T17:11:21Z) - MissDAG: Causal Discovery in the Presence of Missing Data with
Continuous Additive Noise Models [78.72682320019737]
不完全な観測データから因果発見を行うため,MissDAGと呼ばれる一般的な手法を開発した。
MissDAGは、期待-最大化の枠組みの下で観測の可視部分の期待される可能性を最大化する。
各種因果探索アルゴリズムを組み込んだMissDAGの柔軟性について,広範囲なシミュレーションと実データ実験により検証した。
論文 参考訳(メタデータ) (2022-05-27T09:59:46Z) - The interventional Bayesian Gaussian equivalent score for Bayesian
causal inference with unknown soft interventions [0.0]
ゲノミクスのような特定の環境では、不均一な研究条件からのデータがあり、研究変数のサブセットのみに関連するソフトな(部分的な)介入がある。
観察データと介入データとの混合に対する介入BGeスコアを定義し,介入の目的と効果が不明である可能性がある。
論文 参考訳(メタデータ) (2022-05-05T12:32:08Z) - Error-based Knockoffs Inference for Controlled Feature Selection [49.99321384855201]
本手法では, ノックオフ特徴量, エラーベース特徴重要度統計量, ステップダウン手順を一体化して, エラーベースのノックオフ推定手法を提案する。
提案手法では回帰モデルを指定する必要はなく,理論的保証で特徴選択を処理できる。
論文 参考訳(メタデータ) (2022-03-09T01:55:59Z) - Leveraging Global Parameters for Flow-based Neural Posterior Estimation [90.21090932619695]
実験観測に基づくモデルのパラメータを推定することは、科学的方法の中心である。
特に困難な設定は、モデルが強く不確定であるとき、すなわち、パラメータの異なるセットが同一の観測をもたらすときである。
本稿では,グローバルパラメータを共有する観測の補助的セットによって伝達される付加情報を利用して,その不確定性を破る手法を提案する。
論文 参考訳(メタデータ) (2021-02-12T12:23:13Z) - Decorrelated Clustering with Data Selection Bias [55.91842043124102]
本稿では,データ選択バイアスを伴うクラスタリングのためのデコリレーション正規化K-Meansアルゴリズム(DCKM)を提案する。
DCKMアルゴリズムは,選択バイアスによって生じる予期せぬ特徴相関を除去する必要があることを示す。
論文 参考訳(メタデータ) (2020-06-29T08:55:50Z) - On Bayesian Search for the Feasible Space Under Computationally
Expensive Constraints [0.0]
実現可能空間と実現不可能空間の境界に解が存在する確率を結合した新しい獲得関数を提案する。
実験により提案機能の有効性が確認された。
論文 参考訳(メタデータ) (2020-04-23T10:22:32Z) - A Robust Functional EM Algorithm for Incomplete Panel Count Data [66.07942227228014]
完全無作為な仮定(MCAR)の下での数え上げ過程の平均関数を推定する機能的EMアルゴリズムを提案する。
提案アルゴリズムは、いくつかの一般的なパネル数推定手法をラップし、不完全数にシームレスに対処し、ポアソン過程の仮定の誤特定に頑健である。
本稿では, 数値実験による提案アルゴリズムの有用性と喫煙停止データの解析について述べる。
論文 参考訳(メタデータ) (2020-03-02T20:04:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。