論文の概要: Bayesian Optimization -- Multi-Armed Bandit Problem
- arxiv url: http://arxiv.org/abs/2012.07885v1
- Date: Mon, 14 Dec 2020 19:08:37 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-08 19:12:42.975891
- Title: Bayesian Optimization -- Multi-Armed Bandit Problem
- Title(参考訳): ベイズ最適化-多元帯域問題
- Authors: Abhilash Nandy, Chandan Kumar, Deepak Mewada, Soumya Sharma
- Abstract要約: ベイズ最適化を論じた論文において,取得機能とポートフォリオ戦略の種類に関する小文献調査を行った。
また、実験を複製し、調査結果を報告し、論文の結果と比較します。
- 参考スコア(独自算出の注目度): 1.454605112111925
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In this report, we survey Bayesian Optimization methods focussed on the
Multi-Armed Bandit Problem. We take the help of the paper "Portfolio Allocation
for Bayesian Optimization". We report a small literature survey on the
acquisition functions and the types of portfolio strategies used in papers
discussing Bayesian Optimization. We also replicate the experiments and report
our findings and compare them to the results in the paper. Code link:
https://colab.research.google.com/drive/1GZ14klEDoe3dcBeZKo5l8qqrKf_GmBDn?usp=sharing#scrollTo=XgIBau3O45_V.
- Abstract(参考訳): 本稿では,マルチアーメッド帯域問題に着目したベイズ最適化手法について検討する。
ベイズ最適化のためのPortfolio Allocation」という論文の助けを借りる。
ベイズ最適化を論じた論文において,取得機能とポートフォリオ戦略の種類に関する小文献調査を行った。
また、実験を再現し、調査結果を報告し、論文の結果と比較した。
コードリンク:https://colab.research.google.com/drive/1GZ14klEDoe3dcBeZKo5l8qrKf_GmBDn?usp=sharing#scrollTo=XgIBau3O45_V
関連論文リスト
- Variational Bayes Portfolio Construction [4.543162447338067]
ベイズパラダイムにおける最適意思決定の問題に取り組む。
私たちはそれをサドルポイント問題として書き直した。
我々はその結果を最先端のアルゴリズムと比較した。
論文 参考訳(メタデータ) (2024-11-09T14:23:14Z) - Batched Bayesian optimization with correlated candidate uncertainties [44.38372821900645]
純粋に活用する qPO (multipoint of Optimality) による離散最適化のための獲得戦略を提案する。
本研究では, 大規模化学ライブラリのモデル誘導探索に適用し, バッチ化ベイズ最適化における最先端手法と同等以上の性能を示すことを示す。
論文 参考訳(メタデータ) (2024-10-08T20:13:12Z) - Cost-aware Bayesian Optimization via the Pandora's Box Gittins Index [57.045952766988925]
我々は,コストを意識したベイズ最適化と,経済学の意思決定問題であるPandoraのBox問題との間に,従来未解決の接続関係を構築した。
我々の研究は、Gittinsインデックス理論からベイズ最適化への技術統合に向けた第一歩となる。
論文 参考訳(メタデータ) (2024-06-28T17:20:13Z) - Preference Exploration for Efficient Bayesian Optimization with Multiple
Outcomes [17.300690315775572]
意思決定者が好むベクトル値結果を生成する実験の最適化を検討する。
これらの選好は、閉じた形では知られていないが、DMに結果ベクトルのペアよりも好みを表現するように求めることで推定できるユーティリティ関数によって符号化される。
我々は,インタラクティブなリアルタイム嗜好学習とDMを交互に行う新しいフレームワークを開発した。
論文 参考訳(メタデータ) (2022-03-21T23:02:50Z) - Optimizer Amalgamation [124.33523126363728]
私たちは、Amalgamationという新しい問題の研究を動機付けています。"Teacher"アマルガメーションのプールを、より強力な問題固有のパフォーマンスを持つ単一の"学生"にどのように組み合わせるべきなのでしょうか?
まず、勾配降下による解析のプールをアマルガメートする3つの異なるメカニズムを定義する。
また, プロセスの分散を低減するため, 目標を摂動させることでプロセスの安定化を図る。
論文 参考訳(メタデータ) (2022-03-12T16:07:57Z) - Bayesian Algorithm Execution: Estimating Computable Properties of
Black-box Functions Using Mutual Information [78.78486761923855]
多くの現実世界では、T関数の評価の予算を考えると、高価なブラックボックス関数 f の性質を推測したい。
本稿では,アルゴリズムの出力に対して相互情報を最大化するクエリを逐次選択する手法InfoBAXを提案する。
これらの問題に対してInfoBAXは、元のアルゴリズムで要求されるより500倍少ないクエリをfに使用する。
論文 参考訳(メタデータ) (2021-04-19T17:22:11Z) - Batch Bayesian Optimization on Permutations using Acquisition Weighted
Kernels [86.11176756341114]
決定点プロセスに基づく新しい効率的なバッチ取得方法であるLAWを紹介します。
本研究では,理論特性の知見を得るための後悔分析法を提案する。
二次代入などの置換を含むいくつかの標準問題に対する手法を評価する。
論文 参考訳(メタデータ) (2021-02-26T10:15:57Z) - Mercer Features for Efficient Combinatorial Bayesian Optimization [32.856318660282255]
ベイズ最適化(Bayesian optimization、BO)は、高価な関数評価でブラックボックス最適化問題を解決するための効率的なフレームワークである。
本稿では,科学や工学の応用において自然に発生する空間(シーケンスやグラフなど)のbo問題の設定について述べる。
重要な課題は、統計モデルの複雑さと検索のトラクタビリティのバランスをとり、評価のための構造を選択することです。
論文 参考訳(メタデータ) (2020-12-14T17:58:39Z) - Optimal Off-Policy Evaluation from Multiple Logging Policies [77.62012545592233]
我々は,複数のロギングポリシからオフ政治評価を行い,それぞれが一定のサイズ,すなわち階層化サンプリングのデータセットを生成する。
複数ロガーのOPE推定器は,任意のインスタンス,すなわち効率のよいインスタンスに対して最小分散である。
論文 参考訳(メタデータ) (2020-10-21T13:43:48Z) - Statistical Efficiency of Thompson Sampling for Combinatorial
Semi-Bandits [56.31950477139053]
半帯域フィードバック(CMAB)を用いたマルチアームバンディットの検討
我々は Combinatorial Thompson Smpling Policy (CTS) の変種を解析する。
この最終結果は,Y Combinatorial Bandit Policy (ESCB) の効率的なサンプリングに代わるものだ。
論文 参考訳(メタデータ) (2020-06-11T17:12:11Z) - Robust Policy Search for Robot Navigation with Stochastic Meta-Policies [5.7871177330714145]
本研究では,ベイズ最適化の主成分を生かして,ポリシー探索アルゴリズムの様々な問題に対して堅牢性を提供する。
いくつかの手法を組み合わせて、それらの相互作用が部品の和よりもどのように機能するかを示す。
提案アルゴリズムを,ロボットアームによるオブジェクトのプッシュやローバーによる経路探索など,いくつかの最適化ベンチマークやロボットタスクにおいて,以前の結果と比較した。
論文 参考訳(メタデータ) (2020-03-02T16:30:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。