論文の概要: Effects of Model Misspecification on Bayesian Bandits: Case Studies in
UX Optimization
- arxiv url: http://arxiv.org/abs/2010.04010v1
- Date: Wed, 7 Oct 2020 14:34:28 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-09 21:51:38.717340
- Title: Effects of Model Misspecification on Bayesian Bandits: Case Studies in
UX Optimization
- Title(参考訳): モデルミス種別がベイズ帯域に及ぼす影響:UX最適化の事例研究
- Authors: Mack Sweeney, Matthew van Adelsberg, Kathryn Laskey, Carlotta
Domeniconi
- Abstract要約: 我々は、新しい定式化を、保存されていない共同創設者とオプションの停止を伴う、安静な睡眠バンディットとして提示する。
ケーススタディは、一般的な不特定が最適以下の報酬につながることを示している。
また、レスレスバンディットにおける結合を利用した最初のモデルを示し、有限の後悔と高速で一貫した停止が可能であることを示した。
- 参考スコア(独自算出の注目度): 8.704145252476705
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Bayesian bandits using Thompson Sampling have seen increasing success in
recent years. Yet existing value models (of rewards) are misspecified on many
real-world problem. We demonstrate this on the User Experience Optimization
(UXO) problem, providing a novel formulation as a restless, sleeping bandit
with unobserved confounders plus optional stopping. Our case studies show how
common misspecifications can lead to sub-optimal rewards, and we provide model
extensions to address these, along with a scientific model building process
practitioners can adopt or adapt to solve their own unique problems. To our
knowledge, this is the first study showing the effects of overdispersion on
bandit explore/exploit efficacy, tying the common notions of under- and
over-confidence to over- and under-exploration, respectively. We also present
the first model to exploit cointegration in a restless bandit, demonstrating
that finite regret and fast and consistent optional stopping are possible by
moving beyond simpler windowing, discounting, and drift models.
- Abstract(参考訳): トンプソンサンプリングを用いたベイジアン・バンディットは近年、成功を収めている。
しかし、既存の価値モデル(報酬)は多くの現実世界の問題で不特定化されている。
ユーザエクスペリエンス最適化(UXO)問題でこれを実証し、保存されていない共同創設者とオプションの停止を備えた、安静な睡眠バンドウィットとして、新しい定式化を提供する。
ケーススタディでは、一般的なミススペクテーションがサブ最適報酬につながることを示し、これらに対処するためのモデル拡張と、実践者が独自の問題を解決するための科学的モデル構築プロセスを提供する。
我々の知る限り、過分散が帯域探索および探索効果に与える影響を示す最初の研究であり、過分散と過分散の共通概念を、過度探索と過度探索に結びつけるものである。
また,より単純なウィンドウニング,ディスカウント,ドリフトモデルを超えて,有限の後悔と高速かつ一貫性のあるオプション停止が可能であることを実証し,restless banditにおける共統合を利用する最初のモデルを提案する。
関連論文リスト
- Neural Dueling Bandits [58.90189511247936]
ニューラルネットワークを用いて、予め選択した腕の好みフィードバックを用いて報酬関数を推定する。
次に、理論結果を二項フィードバックによる文脈的帯域幅問題に拡張し、それはそれ自体は自明な寄与ではない。
論文 参考訳(メタデータ) (2024-07-24T09:23:22Z) - Causal Bandits: The Pareto Optimal Frontier of Adaptivity, a Reduction to Linear Bandits, and Limitations around Unknown Marginals [28.94461817548213]
条件付き良性環境と任意の環境下での学習性能におけるトレードオフの可能性について,上界と下界の整合性を証明した。
この問題を線形バンディット設定に還元することで、最初に因果バンディットのインスタンス依存境界を求める。
論文 参考訳(メタデータ) (2024-07-01T04:12:15Z) - Predictive Churn with the Set of Good Models [64.05949860750235]
近似機械学習モデルの集合に対する競合予測の効果について検討する。
ラーショモン集合内のモデル間の係り受けに関する理論的結果を示す。
当社のアプローチは、コンシューマ向けアプリケーションにおいて、より予測し、削減し、混乱を避けるためにどのように使用できるかを示します。
論文 参考訳(メタデータ) (2024-02-12T16:15:25Z) - Source-Free Unsupervised Domain Adaptation with Hypothesis Consolidation
of Prediction Rationale [53.152460508207184]
Source-Free Unsupervised Domain Adaptation (SFUDA)は、モデルがターゲットのドメインラベルやソースドメインデータにアクセスせずに新しいドメインに適応する必要がある、という課題である。
本稿では,各サンプルについて複数の予測仮説を考察し,各仮説の背景にある理論的根拠について考察する。
最適性能を達成するために,モデル事前適応,仮説統合,半教師付き学習という3段階の適応プロセスを提案する。
論文 参考訳(メタデータ) (2024-02-02T05:53:22Z) - Dropout-Based Rashomon Set Exploration for Efficient Predictive
Multiplicity Estimation [15.556756363296543]
予測多重性(英: Predictive multiplicity)とは、ほぼ等しい最適性能を達成する複数の競合モデルを含む分類タスクを指す。
本稿では,Rashomon 集合のモデル探索にドロップアウト手法を利用する新しいフレームワークを提案する。
本手法は, 予測多重度推定の有効性の観点から, ベースラインを一貫して上回ることを示す。
論文 参考訳(メタデータ) (2024-02-01T16:25:00Z) - Single-Model Attribution of Generative Models Through Final-Layer Inversion [16.506531590300806]
最終層逆転と異常検出に基づくオープンワールド設定における単一モデル属性に対する新しいアプローチを提案する。
得られた最終層インバージョンを凸ラッソ最適化問題に還元し,理論的に健全で計算効率がよいことを示す。
論文 参考訳(メタデータ) (2023-05-26T13:06:38Z) - Making Substitute Models More Bayesian Can Enhance Transferability of
Adversarial Examples [89.85593878754571]
ディープニューラルネットワークにおける敵の例の転送可能性は多くのブラックボックス攻撃の欠如である。
我々は、望ましい転送可能性を達成するためにベイズモデルを攻撃することを提唱する。
我々の手法は近年の最先端を大きなマージンで上回る。
論文 参考訳(メタデータ) (2023-02-10T07:08:13Z) - Bias-Robust Bayesian Optimization via Dueling Bandit [57.82422045437126]
ベイジアン最適化は、観測が逆偏りとなるような環境において考慮する。
情報指向サンプリング(IDS)に基づくダリングバンディットの新しい手法を提案する。
これにより、累積的後悔保証を伴う帯域幅の並列化のための、最初の効率的なカーネル化アルゴリズムが得られる。
論文 参考訳(メタデータ) (2021-05-25T10:08:41Z) - A Twin Neural Model for Uplift [59.38563723706796]
Upliftは条件付き治療効果モデリングの特定のケースです。
相対リスクのベイズ解釈との関連性を利用して定義した新たな損失関数を提案する。
本提案手法は,シミュレーション設定の最先端と大規模ランダム化実験による実データとの競合性を示す。
論文 参考訳(メタデータ) (2021-05-11T16:02:39Z) - Towards Robust and Reliable Algorithmic Recourse [11.887537452826624]
モデルシフトに堅牢なリコースを見つけるための敵対的トレーニングを活用する新しいフレームワークであるRObust Algorithmic Recourse(ROAR)を提案します。
また,モデルシフトにロバストなリコースの構築の重要性を強調する詳細な理論解析を行う。
論文 参考訳(メタデータ) (2021-02-26T17:38:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。