Fugu-MT 論文翻訳(概要): Diffusion Asymptotics for Sequential Experiments

論文の概要: Diffusion Asymptotics for Sequential Experiments

arxiv url: http://arxiv.org/abs/2101.09855v2
Date: Wed, 10 Feb 2021 03:50:40 GMT
ステータス: 翻訳完了
システム内更新日: 2021-03-16 07:59:44.095146
Title: Diffusion Asymptotics for Sequential Experiments
Title（参考訳）: 逐次実験のための拡散漸近
Authors: Stefan Wager and Kuang Xu
Abstract要約: 本研究では, 連続実験の手法群の挙動が拡散限界に収束することを示した。この接続により、鋭い予測を行い、トンプソンサンプリングの挙動に関する新たな知見を得ることができる。
参考スコア（独自算出の注目度）: 8.98526174345299
License: http://creativecommons.org/licenses/by/4.0/
Abstract: We propose a new diffusion-asymptotic analysis for sequentially randomized experiments. Rather than taking sample size $n$ to infinity while keeping the problem parameters fixed, we let the mean signal level scale to the order $1/\sqrt{n}$ so as to preserve the difficulty of the learning task as $n$ gets large. In this regime, we show that the behavior of a class of methods for sequential experimentation converges to a diffusion limit. This connection enables us to make sharp performance predictions and obtain new insights on the behavior of Thompson sampling. Our diffusion asymptotics also help resolve a discrepancy between the $\Theta(\log(n))$ regret predicted by the fixed-parameter, large-sample asymptotics on the one hand, and the $\Theta(\sqrt{n})$ regret from worst-case, finite-sample analysis on the other, suggesting that it is an appropriate asymptotic regime for understanding practical large-scale sequential experiments.
Abstract（参考訳）: 逐次ランダム化実験のための新しい拡散漸近解析を提案する。問題パラメータを固定しながら無限大に$n$を取るのではなく、平均信号レベルを$/\sqrt{n}$にスケールさせ、$n$が大きくなるにつれて学習タスクの難易度を維持するようにします。この体制では、連続実験のための一連の方法の挙動が拡散限界に収束することを示した。この接続により、鋭い性能予測を行い、トンプソンサンプリングの挙動に関する新たな知見を得ることができる。私たちの拡散無症状学は、固定パラメータによって予測される$\Theta(\log(n))$の後悔と、最悪の場合からの$\Theta(\sqrt{n})$の後悔、もう一方の有限サンプル分析との相違を解決するのにも役立ち、実用的な大規模な連続実験を理解するための適切な無症状体制であることが示唆されている。

関連論文リスト

Optimism Stabilizes Thompson Sampling for Adaptive Inference [9.558593674952654]
トンプソンサンプリング(TS)は多武装の包帯に広く用いられているが、適応データ収集における推論特性は微妙である。我々は、この現象を$K$武器のガウス・バンディットで研究し、エンホプティミズムをエンホスタビリティの回復の鍵となるメカニズムとして認識する。分散膨張型TS citephalder2025stableは、複数のアームが最適である難易度を含む、任意のK ge 2$に対して安定であることを示す。
論文参考訳（メタデータ） (2026-02-05T18:52:54Z)
The Polynomial Stein Discrepancy for Assessing Moment Convergence [1.0835264351334324]
本研究では,サンプルの集合とベイズ推定のための所望の後方分布との差を測定する新しい手法を提案する。いくつかの例において、このテストは競合他社よりも高いパワーを持ち、計算コストが低いことを示す。
論文参考訳（メタデータ） (2024-12-06T15:51:04Z)
REAL Sampling: Boosting Factuality and Diversity of Open-Ended Generation via Asymptotic Entropy [93.8400683020273]
大規模言語モデル(LLM)の復号法は通常、事実性の確保と多様性の維持のトレードオフに苦慮する。核サンプリングにおける事実性および多様性を向上させる復号法であるREALサンプリングを提案する。
論文参考訳（メタデータ） (2024-06-11T21:44:49Z)
Sampling in Constrained Domains with Orthogonal-Space Variational Gradient Descent [13.724361914659438]
多様体上のサンプリングのための直交空間勾配流(O-Gradient)を設計した新しい変分フレームワークを提案する。我々は、O-Gradient が目標制約分布に収束し、弱条件下では、$widetildeO (1/textthe number of iterations)$$で収束することを証明した。
論文参考訳（メタデータ） (2022-10-12T17:51:13Z)
Finite-Time Regret of Thompson Sampling Algorithms for Exponential Family Multi-Armed Bandits [88.21288104408556]
本研究では,指数関数族バンドイットに対するトンプソンサンプリング (TS) アルゴリズムの遺残について検討する。最適な腕の過小評価を避けるために,新しいサンプリング分布を用いたトンプソンサンプリング(Expulli)を提案する。
論文参考訳（メタデータ） (2022-06-07T18:08:21Z)
Algorithms for Adaptive Experiments that Trade-off Statistical Analysis with Reward: Combining Uniform Random Assignment and Reward Maximization [50.725191156128645]
トンプソンサンプリングのようなマルチアームバンディットアルゴリズムは適応的な実験を行うのに利用できる。統計的解析のための一様ランダム化の利点を組み合わせた2つのアルゴリズムを探索する2つのアーム実験のシミュレーションを提案する。
論文参考訳（メタデータ） (2021-12-15T22:11:58Z)
From Optimality to Robustness: Dirichlet Sampling Strategies in Stochastic Bandits [0.0]
本研究では、腕の観察を再サンプリングした経験的指標のペア比較に基づいて、ジェネリックディリクレサンプリング(DS)アルゴリズムについて検討する。この戦略の異なる変種は、分布が有界であるときに証明可能な最適後悔保証と、半有界分布に対して軽度量子状態の対数後悔を実現することを示す。
論文参考訳（メタデータ） (2021-11-18T14:34:21Z)
Generalized Kernel Ridge Regression for Causal Inference with Missing-at-Random Sample Selection [3.398662563413433]
非パラメトリック線量応答曲線と半パラメトリック処理効果に対するカーネルリッジ回帰推定器を提案する。離散処理の場合,ルートnの整合性,ガウス近似,半パラメトリック効率を証明した。
論文参考訳（メタデータ） (2021-11-09T17:10:49Z)
Efficient Inference Without Trading-off Regret in Bandits: An Allocation Probability Test for Thompson Sampling [1.6114012813668934]
適応ランダム化実験を行うのにバンドアルゴリズムを用いると、後悔を最小限に抑えることができるが、統計的推測には大きな課題が生じる。これらの課題に対処しようとする最近の試みは、典型的には、保証を保証するために、B bandit$-$trading off regret$-$-$ 大きなサンプルサイズを必要とする。バンディットアルゴリズムの割り当て確率に一意的に基づく新しい仮説テストを導入し,その利用性を制限したり,最小限の実験サイズを必要としない。我々は、我々のアプローチ、特に小さなサンプルにおいて、広範囲なシミュレーションと実際のメンタルヘルスに関する実験の両方において、後悔と推論の利点を実証する。
論文参考訳（メタデータ） (2021-10-30T01:47:14Z)
Heavy-tailed Streaming Statistical Estimation [58.70341336199497]
ストリーミング$p$のサンプルから重み付き統計推定の課題を考察する。そこで我々は,傾きの雑音に対して,よりニュアンスな条件下での傾きの傾きの低下を設計し,より詳細な解析を行う。
論文参考訳（メタデータ） (2021-08-25T21:30:27Z)
A Unifying Theory of Thompson Sampling for Continuous Risk-Averse Bandits [91.3755431537592]
本稿では,多腕バンディット問題に対するリスク-逆トンプソンサンプリングアルゴリズムの解析を統一する。大規模偏差理論における収縮原理を用いることで、連続リスク汎関数に対する新しい濃度境界が証明される。リスク関数の幅広いクラスと「ニセ」関数が連続性条件を満たすことを示す。
論文参考訳（メタデータ） (2021-08-25T17:09:01Z)
Tracking disease outbreaks from sparse data with Bayesian inference [55.82986443159948]
新型コロナウイルス(COVID-19)のパンデミックは、感染発生時の感染率を推定する新たな動機を与える。標準的な手法は、より細かいスケールで共通する部分的な観測可能性とスパースなデータに対応するのに苦労する。原理的に部分観測可能なベイズ的枠組みを提案する。
論文参考訳（メタデータ） (2020-09-12T20:37:33Z)
Double Trouble in Double Descent : Bias and Variance(s) in the Lazy Regime [32.65347128465841]
深層ニューラルネットワークは、トレーニングデータを完璧に補間しながら、素晴らしいパフォーマンスを達成することができる。バイアス分散トレードオフのU曲線ではなく、テストエラーはしばしば「二重降下」に従う。我々は、ニューラルネットワークのいわゆる遅延学習システムにおいて、この現象の定量的理論を開発する。
論文参考訳（メタデータ） (2020-03-02T17:39:31Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。