論文の概要: A Central Limit Theorem, Loss Aversion and Multi-Armed Bandits
- arxiv url: http://arxiv.org/abs/2106.05472v1
- Date: Thu, 10 Jun 2021 03:15:11 GMT
- ステータス: 処理完了
- システム内更新日: 2021-06-11 14:29:10.583621
- Title: A Central Limit Theorem, Loss Aversion and Multi-Armed Bandits
- Title(参考訳): 中心極限定理、損失回避と多腕バンディット
- Authors: Zengjing Chen, Larry G. Epstein, Guodong Zhang
- Abstract要約: 本稿では、条件分散がほとんど構造化されていない歴史依存的な方法で変化できるという仮定のもと、中心極限定理を確立する。
第二の寄与は、この結果が、意思決定者が損失を逆転する多武装バンディット問題に適用されることである。
- 参考スコア(独自算出の注目度): 17.01946686700843
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper establishes a central limit theorem under the assumption that
conditional variances can vary in a largely unstructured history-dependent way
across experiments subject only to the restriction that they lie in a fixed
interval. Limits take a novel and tractable form, and are expressed in terms of
oscillating Brownian motion. A second contribution is application of this
result to a class of multi-armed bandit problems where the decision-maker is
loss averse.
- Abstract(参考訳): 本稿では, 条件分散が, 一定間隔の制限のみを条件とする実験において, ほとんど構造化されていない履歴依存の方法で変化できるという仮定の下で, 中心極限定理を確立する。
極限は、新しくて取り外し可能な形式をとり、ブラウン運動の振動の言葉で表される。
第2の貢献は、意思決定者が損失逆であるマルチアームバンディット問題のクラスにこの結果を適用することである。
関連論文リスト
- PAC-Bayes-Chernoff bounds for unbounded losses [9.987130158432755]
PAC-Bayes Oracle bound for unbounded loss that extends Cram'er-Chernoff bounds to the PAC-Bayesian set。
我々のアプローチは、多くのPAC-Bayes境界における自由パラメータの正確な最適化など、Cram'er-Chernoff境界の性質を自然に活用する。
論文 参考訳(メタデータ) (2024-01-02T10:58:54Z) - Addressing Discontinuous Root-Finding for Subsequent Differentiability
in Machine Learning, Inverse Problems, and Control [5.610530869913159]
本論文は,2つの剛体・変形体間の衝突の特定の事例を動機としたものである。
衝突時間のパラメータに対する微分は、衝突しない障壁に近づくと無限となることを示す。
デリバティブによって引き起こされる障壁を動員し、標準的な数値的アプローチの活用を容易にし、スムーズで信頼性の高い方法でトンネルを行き来できるようにします。
論文 参考訳(メタデータ) (2023-06-21T17:51:32Z) - Role of boundary conditions in the full counting statistics of
topological defects after crossing a continuous phase transition [62.997667081978825]
トポロジカル欠陥の統計学における境界条件の役割を解析する。
また, クイン数分布の累積は, クエンチ率に比例して普遍的なスケーリングを示すことを示した。
論文 参考訳(メタデータ) (2022-07-08T09:55:05Z) - Lifting the Convex Conjugate in Lagrangian Relaxations: A Tractable
Approach for Continuous Markov Random Fields [53.31927549039624]
断片的な離散化は既存の離散化問題と矛盾しないことを示す。
この理論を2つの画像のマッチング問題に適用する。
論文 参考訳(メタデータ) (2021-07-13T12:31:06Z) - Combinatorial Blocking Bandits with Stochastic Delays [33.65025386998747]
最近の研究は、各腕の報酬が最後の引き抜きから経過した時間の特別な機能であるマルチアームバンディット問題の自然変化を考察している。
本研究では, 上記のモデルを2つの方向に拡張する。 (i) 各ラウンドで複数の腕を演奏できる汎用的な設定を, 実現可能性制約の下で検討する。
我々は、利用可能な(非ブロック化された)アームの中で、常に最大で期待される報酬を再生する自然な欲求部分集合の近似を厳密に分析する。
腕の期待報酬が不明な場合、上記のアルゴリズムを盗賊に適応させる。
論文 参考訳(メタデータ) (2021-05-22T02:46:04Z) - Generalized non-stationary bandits [78.05847530997926]
スイッチングバンドイット問題を一般化する非定常バンドイット問題について検討する。
本稿では, 4つの問題 (a)-(d) を効率よく, 統一的に解く単一アルゴリズムを提案する。
論文 参考訳(メタデータ) (2021-02-01T09:34:44Z) - On Lower Bounds for Standard and Robust Gaussian Process Bandit
Optimization [55.937424268654645]
有界ノルムを持つ関数のブラックボックス最適化問題に対するアルゴリズム非依存な下界を考える。
本稿では, 単純さ, 汎用性, エラー確率への依存性の向上など, 後悔の下位境界を導出するための新しい証明手法を提案する。
論文 参考訳(メタデータ) (2020-08-20T03:48:14Z) - On Localized Discrepancy for Domain Adaptation [146.4580736832752]
本稿では,局所化後の仮説空間上で定義される局所的不一致について検討する。
2つの領域を交換すると、それらの値が異なるため、非対称な移動困難が明らかになる。
論文 参考訳(メタデータ) (2020-08-14T08:30:02Z) - Error measurements for a quantum annealer using the one-dimensional
Ising model with twisted boundaries [2.3671223511102486]
2つの端でスピン偏極と反対のスピン偏極を持つ有限長強磁性鎖は、最も単純なフラストレーションスピンモデルの一つである。
我々は、この鎖と反平行境界スピンを用いて、実際のフラックス量子ビット量子アニールを試験した。
実効ランダム場の強度を決定するために、我々の発見した効果がどのように利用できるかを示す。
論文 参考訳(メタデータ) (2020-06-13T17:17:42Z) - Lower bounds in multiple testing: A framework based on derandomized
proxies [107.69746750639584]
本稿では, 各種コンクリートモデルへの適用例を示す, デランドマイズに基づく分析戦略を提案する。
これらの下界のいくつかを数値シミュレーションし、Benjamini-Hochberg (BH) アルゴリズムの実際の性能と密接な関係を示す。
論文 参考訳(メタデータ) (2020-05-07T19:59:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。