論文の概要: Active recursive Bayesian inference using R\'enyi information measures
- arxiv url: http://arxiv.org/abs/2004.03139v2
- Date: Wed, 10 Mar 2021 16:35:34 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-15 23:40:47.041490
- Title: Active recursive Bayesian inference using R\'enyi information measures
- Title(参考訳): R'enyi情報測度を用いたアクティブ再帰ベイズ推定
- Authors: Yeganeh M. Marghi, Aziz Kocanaogullari, Murat Akcakaya, Deniz Erdogmus
- Abstract要約: 本稿では,統合された推論とクエリ選択ステップを備えたベイズ推論フレームワークを提案する。
提案手法が相互情報などの従来の手法より優れていることを示す。
本稿では,レストランレコメンデーションとブレイン・コンピュータ・インタフェース(BCI)タイピングシステムの2つの応用に関する実証的および実験的性能評価を行う。
- 参考スコア(独自算出の注目度): 11.1748531496641
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recursive Bayesian inference (RBI) provides optimal Bayesian latent variable
estimates in real-time settings with streaming noisy observations. Active RBI
attempts to effectively select queries that lead to more informative
observations to rapidly reduce uncertainty until a confident decision is made.
However, typically the optimality objectives of inference and query mechanisms
are not jointly selected. Furthermore, conventional active querying methods
stagger due to misleading prior information. Motivated by information theoretic
approaches, we propose an active RBI framework with unified inference and query
selection steps through Renyi entropy and $\alpha$-divergence. We also propose
a new objective based on Renyi entropy and its changes called Momentum that
encourages exploration for misleading prior cases. The proposed active RBI
framework is applied to the trajectory of the posterior changes in the
probability simplex that provides a coordinated active querying and decision
making with specified confidence. Under certain assumptions, we analytically
demonstrate that the proposed approach outperforms conventional methods such as
mutual information by allowing the selections of unlikely events. We present
empirical and experimental performance evaluations on two applications:
restaurant recommendation and brain-computer interface (BCI) typing systems.
- Abstract(参考訳): 再帰ベイズ推論(recursive bayesian inference, rbi)は、ストリーミングノイズ観測を伴うリアルタイム設定における最適なベイズ潜在変数推定を提供する。
アクティブRBIは、確実な決定が下されるまで、より情報的な観察につながるクエリを効果的に選択し、不確実性を迅速に減らそうとする。
しかし、一般的には推論とクエリメカニズムの最適目的が一緒に選択されない。
さらに,従来のアクティブクエリ手法は,事前情報の誤解を招くため停滞する。
本稿では,Renyi entropy と $\alpha$-divergence を通じて推論とクエリ選択を統一したアクティブな RBI フレームワークを提案する。
また,renyiエントロピーに基づく新たな目標と,その変化であるモーメントを提案する。
提案したアクティブなRBIフレームワークは、協調したアクティブなクエリと決定を特定の信頼度で提供する確率単純度の後部変化の軌跡に適用する。
特定の仮定の下では,提案手法が,ありそうにない事象の選択を許すことで,相互情報などの従来の手法を上回っていることを解析的に示す。
本稿では,レストランレコメンデーションとブレイン・コンピュータ・インタフェース(BCI)タイピングシステムの2つの応用に関する実証的および実験的性能評価を行う。
関連論文リスト
- Provably Efficient UCB-type Algorithms For Learning Predictive State
Representations [55.00359893021461]
逐次決定問題は、予測状態表現(PSR)によってモデル化された低ランク構造が認められる場合、統計的に学習可能である
本稿では,推定モデルと実モデル間の全変動距離を上限とする新しいボーナス項を特徴とする,PSRに対する最初のUCB型アプローチを提案する。
PSRに対する既存のアプローチとは対照的に、UCB型アルゴリズムは計算的トラクタビリティ、最優先の準最適ポリシー、モデルの精度が保証される。
論文 参考訳(メタデータ) (2023-07-01T18:35:21Z) - Inferring Preferences from Demonstrations in Multi-objective
Reinforcement Learning: A Dynamic Weight-based Approach [0.0]
多目的意思決定において、選好推論は、異なる目的のために意思決定者の選好を推測する過程である。
本研究では,多目的意思決定問題に作用するエージェントの選好を推測する動的重みに基づく選好推論アルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-04-27T11:55:07Z) - On Pitfalls of $\textit{RemOve-And-Retrain}$: Data Processing Inequality
Perspective [5.8010446129208155]
本研究では,RemOve-And-Retrain(ROAR)手法の信頼性について検討した。
理論的基礎と実証的研究から得られた知見から、決定関数に関するより少ない情報を含む属性がROARベンチマークにおいて優れた結果をもたらす可能性が示唆された。
論文 参考訳(メタデータ) (2023-04-26T21:43:42Z) - STEERING: Stein Information Directed Exploration for Model-Based
Reinforcement Learning [111.75423966239092]
遷移モデルの現在の推定値と未知の最適値との間の積分確率距離(IPM)の観点から探索インセンティブを提案する。
KSDに基づく新しいアルゴリズムを開発した。 textbfSTEin information dirtextbfEcted Explor for model-based textbfReinforcement Learntextbfing。
論文 参考訳(メタデータ) (2023-01-28T00:49:28Z) - Active Inference for Autonomous Decision-Making with Contextual
Multi-Armed Bandits [1.3670071336891754]
不確実性の下での自律的なロボット意思決定では、搾取と利用可能な選択肢の探索のトレードオフを考慮する必要がある。
本研究では,近年神経科学の分野で積極的に研究されている能動推論をCMABの代替行動選択戦略として応用する。
論文 参考訳(メタデータ) (2022-09-19T17:11:21Z) - ReAct: Temporal Action Detection with Relational Queries [84.76646044604055]
本研究は,アクションクエリを備えたエンコーダ・デコーダフレームワークを用いて,時間的行動検出(TAD)の進展を図ることを目的とする。
まず,デコーダ内の関係注意機構を提案し,その関係に基づいてクエリ間の関心を誘導する。
最後に、高品質なクエリを区別するために、推論時に各アクションクエリのローカライズ品質を予測することを提案する。
論文 参考訳(メタデータ) (2022-07-14T17:46:37Z) - Meta-Wrapper: Differentiable Wrapping Operator for User Interest
Selection in CTR Prediction [97.99938802797377]
クリックスルー率(CTR)予測は、ユーザーが商品をクリックする確率を予測することを目的としており、リコメンデーションシステムにおいてますます重要になっている。
近年,ユーザの行動からユーザの興味を自動的に抽出する深層学習モデルが大きな成功を収めている。
そこで我々は,メタラッパー(Meta-Wrapper)と呼ばれるラッパー手法の枠組みに基づく新しい手法を提案する。
論文 参考訳(メタデータ) (2022-06-28T03:28:15Z) - Limitations of a proposed correction for slow drifts in decision
criterion [0.0]
ランダムドリフトからの系統的な更新を曖昧にするためのモデルに基づくアプローチを提案する。
提案手法は,決定基準におけるドリフトの潜航軌跡を正確に回復することを示す。
本結果は,生成過程の仮定を直接意思決定モデルに組み込むことの利点を強調した。
論文 参考訳(メタデータ) (2022-05-22T19:33:19Z) - Learning Bias-Invariant Representation by Cross-Sample Mutual
Information Minimization [77.8735802150511]
対象タスクが誤用したバイアス情報を除去するために,クロスサンプル対逆脱バイアス法(CSAD)を提案する。
相関測定は, 対向的偏り評価において重要な役割を担い, クロスサンプル型相互情報推定器によって行われる。
我々は,提案手法の最先端手法に対する利点を検証するために,公開データセットの徹底的な実験を行った。
論文 参考訳(メタデータ) (2021-08-11T21:17:02Z) - Continuous Mean-Covariance Bandits [39.820490484375156]
本稿では,選択肢相関を考慮した連続平均共分散帯域モデルを提案する。
CMCBでは、与えられた選択肢の重みベクトルを逐次選択し、決定に従ってランダムなフィードバックを観察する学習者がいる。
最適な後悔(対数的因子を含む)を伴う新しいアルゴリズムを提案し、それらの最適性を検証するために一致した下界を提供する。
論文 参考訳(メタデータ) (2021-02-24T06:37:05Z) - BSN++: Complementary Boundary Regressor with Scale-Balanced Relation
Modeling for Temporal Action Proposal Generation [85.13713217986738]
我々は,時間的提案生成のための補完的境界回帰器と関係モデリングを利用する新しいフレームワークであるBSN++を提案する。
当然のことながら、提案されたBSN++は、時間的アクションローカライゼーションタスクに関するCVPR19 - ActivityNetのリーダーボードで1位にランクインした。
論文 参考訳(メタデータ) (2020-09-15T07:08:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。