論文の概要: Approximate Thompson Sampling via Epistemic Neural Networks
- arxiv url: http://arxiv.org/abs/2302.09205v1
- Date: Sat, 18 Feb 2023 01:58:15 GMT
- ステータス: 処理完了
- システム内更新日: 2023-02-21 19:48:39.780250
- Title: Approximate Thompson Sampling via Epistemic Neural Networks
- Title(参考訳): 疫学ニューラルネットワークによる近似トンプソンサンプリング
- Authors: Ian Osband, Zheng Wen, Seyed Mohammad Asghari, Vikranth Dwaracherla,
Morteza Ibrahimi, Xiuyuan Lu, Benjamin Van Roy
- Abstract要約: てんかん性ニューラルネットワーク(ENN)は、正確な関節の予測分布を生成するように設計されている。
ENNがこの目的をうまく果たし、共同予測分布の質がいかに性能を向上させるかを示す。
- 参考スコア(独自算出の注目度): 26.872304174606278
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Thompson sampling (TS) is a popular heuristic for action selection, but it
requires sampling from a posterior distribution. Unfortunately, this can become
computationally intractable in complex environments, such as those modeled
using neural networks. Approximate posterior samples can produce effective
actions, but only if they reasonably approximate joint predictive distributions
of outputs across inputs. Notably, accuracy of marginal predictive
distributions does not suffice. Epistemic neural networks (ENNs) are designed
to produce accurate joint predictive distributions. We compare a range of ENNs
through computational experiments that assess their performance in
approximating TS across bandit and reinforcement learning environments. The
results indicate that ENNs serve this purpose well and illustrate how the
quality of joint predictive distributions drives performance. Further, we
demonstrate that the \textit{epinet} -- a small additive network that estimates
uncertainty -- matches the performance of large ensembles at orders of
magnitude lower computational cost. This enables effective application of TS
with computation that scales gracefully to complex environments.
- Abstract(参考訳): トンプソンサンプリング(ts)はアクション選択のための一般的なヒューリスティックであるが、後方分布からのサンプリングが必要である。
残念ながら、ニューラルネットワークを使ってモデル化されたような複雑な環境では、計算に難解になる可能性がある。
近似後部サンプルは効果的な作用を生じるが、入力間の出力の合同予測分布を合理的に近似した場合に限られる。
特に、限界予測分布の精度は十分ではない。
てんかん性ニューラルネットワーク(ENN)は、正確な関節の予測分布を生成するように設計されている。
バンディットおよび強化学習環境におけるts近似性能を評価する計算実験により,ennの範囲を比較した。
その結果, ENN がこの目的をうまく実現し, 共同予測分布の質が性能に与える影響が示唆された。
さらに,不確かさを推定する小さな加算ネットワークである \textit{epinet} が,計算コストが桁違いに低く,大規模なアンサンブルの性能に合致することを示した。
これにより、TSを複雑な環境に優雅にスケールする計算に効果的に適用することができる。
関連論文リスト
- Deep Neural Networks Tend To Extrapolate Predictably [51.303814412294514]
ニューラルネットワークの予測は、アウト・オブ・ディストリビューション(OOD)入力に直面した場合、予測不可能で過信される傾向がある。
我々は、入力データがOODになるにつれて、ニューラルネットワークの予測が一定値に向かう傾向があることを観察する。
我々は、OOD入力の存在下でリスクに敏感な意思決定を可能にするために、私たちの洞察を実際に活用する方法を示します。
論文 参考訳(メタデータ) (2023-10-02T03:25:32Z) - Estimating Regression Predictive Distributions with Sample Networks [17.935136717050543]
モデル不確実性に対する一般的なアプローチは、パラメトリック分布を選択し、最大推定を用いてデータに適合させることである。
選択されたパラメトリック形式は、データ生成分布に不適合であり、信頼できない不確実性推定をもたらす。
出力分布にパラメトリック形式を指定することを避けるため,不確実性をモデル化するためのフレキシブルでスケーラブルなアーキテクチャであるSampleNetを提案する。
論文 参考訳(メタデータ) (2022-11-24T17:23:29Z) - Effective Out-of-Distribution Detection in Classifier Based on
PEDCC-Loss [5.614122064282257]
PEDCC-Loss を用いたアウト・オブ・ディストリビューション例の検出に有効なアルゴリズムを提案する。
PEDCC(Predefined Evenly-Distribution Class Centroids)分類器によって出力される信頼スコアの性質を数学的に解析する。
次に,より効果的なスコアリング機能を構築し,分布内(ID)と分布外(out-of-distriion)を区別する。
論文 参考訳(メタデータ) (2022-04-10T11:47:29Z) - Unrolling Particles: Unsupervised Learning of Sampling Distributions [102.72972137287728]
粒子フィルタリングは複素系の優れた非線形推定を計算するために用いられる。
粒子フィルタは様々なシナリオにおいて良好な推定値が得られることを示す。
論文 参考訳(メタデータ) (2021-10-06T16:58:34Z) - Adversarial Examples Detection with Bayesian Neural Network [57.185482121807716]
本稿では,ランダムな成分が予測器の滑らかさを向上できるという観測によって動機づけられた敵の例を検出するための新しい枠組みを提案する。
本稿では,BATer を略した新しいベイズ対向型サンプル検出器を提案し,対向型サンプル検出の性能を向上させる。
論文 参考訳(メタデータ) (2021-05-18T15:51:24Z) - Sampling-free Variational Inference for Neural Networks with
Multiplicative Activation Noise [51.080620762639434]
サンプリングフリー変動推論のための後方近似のより効率的なパラメータ化を提案する。
提案手法は,標準回帰問題に対する競合的な結果をもたらし,大規模画像分類タスクに適している。
論文 参考訳(メタデータ) (2021-03-15T16:16:18Z) - Robust and integrative Bayesian neural networks for likelihood-free
parameter inference [0.0]
要約統計を学習するための最先端のニューラルネットワークベースの手法は、シミュレーションベースの確率自由パラメータ推論に有望な結果をもたらした。
本研究では,ベイズニューラルネットワークを用いて要約統計学を学習し,カテゴリー分布を用いて後部密度を直接推定する頑健な統合手法を提案する。
論文 参考訳(メタデータ) (2021-02-12T13:45:23Z) - Multi-Sample Online Learning for Spiking Neural Networks based on
Generalized Expectation Maximization [42.125394498649015]
スパイキングニューラルネットワーク(SNN)は、バイナリニューラルダイナミックアクティベーションを通じて処理することで、生物学的脳の効率の一部をキャプチャする。
本稿では, シナプス重みを共有しながら, 独立したスパイキング信号をサンプリングする複数のコンパートメントを活用することを提案する。
鍵となる考え方は、これらの信号を使ってログライクなトレーニング基準のより正確な統計的推定と勾配を求めることである。
論文 参考訳(メタデータ) (2021-02-05T16:39:42Z) - Probabilistic electric load forecasting through Bayesian Mixture Density
Networks [70.50488907591463]
確率的負荷予測(PLF)は、スマートエネルギーグリッドの効率的な管理に必要な拡張ツールチェーンの重要なコンポーネントです。
ベイジアン混合密度ネットワークを枠とした新しいPLFアプローチを提案する。
後方分布の信頼性と計算にスケーラブルな推定を行うため,平均場変動推定と深層アンサンブルを統合した。
論文 参考訳(メタデータ) (2020-12-23T16:21:34Z) - Spatially Adaptive Inference with Stochastic Feature Sampling and
Interpolation [72.40827239394565]
スパースサンプリングされた場所のみの機能を計算することを提案する。
次に、効率的な手順で特徴写像を密に再構築する。
提案したネットワークは、様々なコンピュータビジョンタスクの精度を維持しながら、かなりの計算を省くために実験的に示されている。
論文 参考訳(メタデータ) (2020-03-19T15:36:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。