論文の概要: A Bayesian Approach to Online Planning
- arxiv url: http://arxiv.org/abs/2406.02103v1
- Date: Tue, 4 Jun 2024 08:33:17 GMT
- ステータス: 処理完了
- システム内更新日: 2024-06-05 17:11:25.947241
- Title: A Bayesian Approach to Online Planning
- Title(参考訳): オンライン計画へのベイズ的アプローチ
- Authors: Nir Greshler, David Ben Eli, Carmel Rabinovitz, Gabi Guetta, Liran Gispan, Guy Zohar, Aviv Tamar,
- Abstract要約: モンテカルロの木探索とニューラルネットワークの組み合わせは、オンライン計画に革命をもたらした。
ネットワークのアウトプットに関する不確実性推定が計画の改善に有効かどうかを問う。
このような不確実な定量化を促進するためのベイズ計画手法を開発し、メタ推論文学から古典的な考え方に着想を得た。
- 参考スコア(独自算出の注目度): 14.847090489758992
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The combination of Monte Carlo tree search and neural networks has revolutionized online planning. As neural network approximations are often imperfect, we ask whether uncertainty estimates about the network outputs could be used to improve planning. We develop a Bayesian planning approach that facilitates such uncertainty quantification, inspired by classical ideas from the meta-reasoning literature. We propose a Thompson sampling based algorithm for searching the tree of possible actions, for which we prove the first (to our knowledge) finite time Bayesian regret bound, and propose an efficient implementation for a restricted family of posterior distributions. In addition we propose a variant of the Bayes-UCB method applied to trees. Empirically, we demonstrate that on the ProcGen Maze and Leaper environments, when the uncertainty estimates are accurate but the neural network output is inaccurate, our Bayesian approach searches the tree much more effectively. In addition, we investigate whether popular uncertainty estimation methods are accurate enough to yield significant gains in planning. Our code is available at: https://github.com/nirgreshler/bayesian-online-planning.
- Abstract(参考訳): モンテカルロ木探索とニューラルネットワークの組み合わせは、オンライン計画に革命をもたらした。
ニューラルネットワークの近似が不完全な場合が多いため、ネットワーク出力に関する不確実性推定が計画の改善に有効かどうかを問う。
このような不確実な定量化を促進するためのベイズ計画手法を開発し、メタ推論文学から古典的な考え方に着想を得た。
我々はトンプソンサンプリングに基づく行動木探索アルゴリズムを提案し、このアルゴリズムはベイズ的後悔境界(Bayesian regret bound)を初めて証明し、後続分布の制限された族に対する効率的な実装を提案する。
さらに,木に応用したベイズ-UCB法の変種を提案する。
実証的に、ProcGen MazeとLeaperの環境では、不確実性推定が正確だがニューラルネットワークの出力が不正確である場合、ベイジアンアプローチはより効果的に木を探索する。
また,一般的な不確実性推定手法が計画において有意な利得が得られるほど正確かどうかを検討した。
私たちのコードは、https://github.com/nirgreshler/bayesian-online-planningで利用可能です。
関連論文リスト
- Depth-Bounded Epistemic Planning [50.42592219248395]
本稿では,動的てんかん論理に基づく新しい計画法を提案する。
新規性は、計画エージェントの推論の深さを上界bに制限することである。
推論深度の境界b内における解を持つ計画タスクに関して、完全なものであることを示す。
論文 参考訳(メタデータ) (2024-06-03T09:30:28Z) - Bayesian Online Natural Gradient (BONG) [9.800443064368467]
変分ベイズ(VB)に基づく逐次ベイズ推論への新しいアプローチを提案する。
重要な洞察は、オンライン環境では、前もって正規化するためにKLという用語を追加する必要はありません。
提案手法は,非共役条件下での他のオンラインVB手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2024-05-30T04:27:36Z) - Model-Free Local Recalibration of Neural Networks [0.0]
可算確率予測は、多くの重要な意思決定タスクに限られている。
入力の次元再現表現を用いたANN予測分布の局所的再分類を提案する。
提案手法は,代替手法と比較して優れた性能を示す。
論文 参考訳(メタデータ) (2024-03-09T01:58:45Z) - Learning Active Subspaces for Effective and Scalable Uncertainty
Quantification in Deep Neural Networks [13.388835540131508]
本稿では,ニューラルネットワークパラメータの低次元部分空間を構築するための新しい手法を提案する。
その結果, 有効かつスケーラブルなベイズ推定が可能であることを実証した。
提案手法は, 各種回帰タスクに対して, 頑健な不確実性推定を伴う信頼性予測を提供する。
論文 参考訳(メタデータ) (2023-09-06T15:00:36Z) - Semantic Strengthening of Neuro-Symbolic Learning [85.6195120593625]
ニューロシンボリックアプローチは一般に確率論的目的のファジィ近似を利用する。
トラクタブル回路において,これを効率的に計算する方法を示す。
我々は,Warcraftにおける最小コストパスの予測,最小コスト完全マッチングの予測,スドクパズルの解法という3つの課題に対して,アプローチを検証した。
論文 参考訳(メタデータ) (2023-02-28T00:04:22Z) - Improved uncertainty quantification for neural networks with Bayesian
last layer [0.0]
不確実性定量化は機械学習において重要な課題である。
本稿では,BLL を用いた NN の対数乗算可能性の再構成を行い,バックプロパゲーションを用いた効率的なトレーニングを実現する。
論文 参考訳(メタデータ) (2023-02-21T20:23:56Z) - Layer Ensembles [95.42181254494287]
本稿では,ネットワークの各層に対する独立なカテゴリ分布の集合を考慮した不確実性推定手法を提案する。
その結果,メモリと実行時間が少なくなるモデルが得られた。
論文 参考訳(メタデータ) (2022-10-10T17:52:47Z) - BayesCap: Bayesian Identity Cap for Calibrated Uncertainty in Frozen
Neural Networks [50.15201777970128]
本研究では,凍結モデルに対するベイズIDマッピングを学習し,不確実性の推定を可能にするBayesCapを提案する。
BayesCapは、元のデータセットのごく一部でトレーニングできる、メモリ効率のよいメソッドである。
本稿では,多種多様なアーキテクチャを用いた多種多様なタスクに対する本手法の有効性を示す。
論文 参考訳(メタデータ) (2022-07-14T12:50:09Z) - Robustification of Online Graph Exploration Methods [59.50307752165016]
我々は、古典的で有名なオンライングラフ探索問題の学習強化版について研究する。
本稿では,予測をよく知られたNearest Neighbor(NN)アルゴリズムに自然に統合するアルゴリズムを提案する。
論文 参考訳(メタデータ) (2021-12-10T10:02:31Z) - Bayesian Optimization Meets Laplace Approximation for Robotic
Introspection [41.117361086267806]
本稿では,Deep Neural Networks(DNN)をよりイントロスペクティブにするために,スケーラブルなLaplace Approximation (LA)技術を導入する。
特に,本論文では,真の重み付け後部を過小評価する傾向を緩和する新しいベイズ最適化(BO)アルゴリズムを提案する。
提案するフレームワークは,大規模データセットやアーキテクチャにまで拡張可能であることを示す。
論文 参考訳(メタデータ) (2020-10-30T09:28:10Z) - ESPN: Extremely Sparse Pruned Networks [50.436905934791035]
簡単な反復マスク探索法により,非常に深いネットワークの最先端の圧縮を実現することができることを示す。
本アルゴリズムは,シングルショット・ネットワーク・プルーニング法とロッテ・ティケット方式のハイブリッド・アプローチを示す。
論文 参考訳(メタデータ) (2020-06-28T23:09:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。