論文の概要: Geometry of the Minimum Volume Confidence Sets
- arxiv url: http://arxiv.org/abs/2202.08180v1
- Date: Wed, 16 Feb 2022 16:36:05 GMT
- ステータス: 処理完了
- システム内更新日: 2022-02-17 14:34:06.060637
- Title: Geometry of the Minimum Volume Confidence Sets
- Title(参考訳): 最小体積信頼集合の幾何学
- Authors: Heguang Lin, Mengze Li, Daniel Pimentel-Alarc\'on, Matthew Malloy
- Abstract要約: 本稿では,多項パラメータに対する最小体積信頼集合の幾何について検討する。
より標準的な信頼セットと境界と近似に基づく間隔の代わりに使用される場合、学習アルゴリズムは複雑さの向上を示すことができる。
- 参考スコア(独自算出の注目度): 0.6882042556551609
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Computation of confidence sets is central to data science and machine
learning, serving as the workhorse of A/B testing and underpinning the
operation and analysis of reinforcement learning algorithms. This paper studies
the geometry of the minimum-volume confidence sets for the multinomial
parameter. When used in place of more standard confidence sets and intervals
based on bounds and asymptotic approximation, learning algorithms can exhibit
improved sample complexity. Prior work showed the minimum-volume confidence
sets are the level-sets of a discontinuous function defined by an exact
p-value. While the confidence sets are optimal in that they have minimum
average volume, computation of membership of a single point in the set is
challenging for problems of modest size. Since the confidence sets are
level-sets of discontinuous functions, little is apparent about their geometry.
This paper studies the geometry of the minimum volume confidence sets by
enumerating and covering the continuous regions of the exact p-value function.
This addresses a fundamental question in A/B testing: given two multinomial
outcomes, how can one determine if their corresponding minimum volume
confidence sets are disjoint? We answer this question in a restricted setting.
- Abstract(参考訳): 信頼性セットの計算は、データサイエンスと機械学習の中心であり、a/bテストの成果であり、強化学習アルゴリズムの運用と分析の基盤となっている。
本稿では,多項パラメータに対する最小体積信頼集合の幾何について検討する。
より標準的な信頼セットと境界と漸近近似に基づく間隔の代わりに使用される場合、学習アルゴリズムはサンプルの複雑さを改善することができる。
先行研究では、最小体積信頼集合は正確な p-値によって定義される不連続関数のレベル集合であることを示した。
信頼セットは最小平均体積を持つという点で最適であるが、集合内の単一点のメンバシップの計算は、控えめなサイズの問題では難しい。
信頼集合は不連続函数のレベル集合であるため、その幾何学についてはほとんど明らかでない。
本稿では, p-値関数の連続領域を列挙し, 被覆することにより, 最小体積信頼集合の幾何について検討する。
これはA/Bテストにおける根本的な問題に対処する: 2つの多重項結果が与えられたとき、対応する最小体積信頼集合が非結合であるかどうかをどうやって決定できるのか?
私たちはこの質問を限定的に答える。
関連論文リスト
- Active Level Set Estimation for Continuous Search Space with Theoretical
Guarantee [10.609848119555975]
本稿では,離散化を必要とせず,連続的な探索空間で直接動作する新しいアルゴリズムを提案する。
提案手法は,与えられた閾値よりも高いあるいは低い関数の信頼度尺度として定義される獲得関数を構築することによって,ポイントを提案する。
複数の合成および実世界のデータセットにおいて、我々のアルゴリズムは最先端の手法より優れている。
論文 参考訳(メタデータ) (2024-02-26T01:46:56Z) - Improved Sample Complexity Bounds for Distributionally Robust
Reinforcement Learning [3.222802562733787]
トレーニング環境とテスト環境のパラメータミスマッチに対して頑健な制御ポリシーを学習することの問題点を考察する。
本研究では,4つの異なる発散によって特定される不確実性集合に対して,ロバスト位相値学習(RPVL)アルゴリズムを提案する。
提案アルゴリズムは,既存の結果より一様によいサンプル複雑性を$tildemathcalO(|mathcalSmathcalA| H5)$とする。
論文 参考訳(メタデータ) (2023-03-05T21:47:08Z) - Minimax Optimization: The Case of Convex-Submodular [50.03984152441271]
ミニマックス問題は連続領域を超えて連続離散領域や完全離散領域にまで拡張される。
連続変数に関して目的が凸であり、離散変数に関して部分モジュラーであるような凸-部分モジュラーミニマックス問題のクラスを導入する。
提案アルゴリズムは反復的であり、離散最適化と連続最適化の両方のツールを組み合わせる。
論文 参考訳(メタデータ) (2021-11-01T21:06:35Z) - A Boosting Approach to Reinforcement Learning [59.46285581748018]
複雑度が状態数に依存しない意思決定プロセスにおける強化学習のための効率的なアルゴリズムについて検討する。
このような弱い学習手法の精度を向上させることができる効率的なアルゴリズムを提供する。
論文 参考訳(メタデータ) (2021-08-22T16:00:45Z) - Instance-optimality in optimal value estimation: Adaptivity via
variance-reduced Q-learning [99.34907092347733]
本稿では,マルコフ決定過程における最適な$Q$値関数を離散状態と動作で推定する問題を解析する。
局所的なミニマックスフレームワークを用いて、この関数は任意の推定手順の精度の低い境界に現れることを示す。
他方,Q$ラーニングの分散還元版を解析することにより,状態と行動空間の対数的要因まで,下位境界のシャープさを確立する。
論文 参考訳(メタデータ) (2021-06-28T00:38:54Z) - Optimal Query Complexity of Secure Stochastic Convex Optimization [17.35823773611766]
安全凸最適化問題について検討する。
学習者は(確率的な)勾配を逐次クエリすることで凸関数の最適点を学習することを目指している。
その間,学習者の学習結果を学習者のクエリを観察することから解放し,推論することを目的とした敵が存在する。
論文 参考訳(メタデータ) (2021-04-05T14:10:26Z) - Causal Inference Under Unmeasured Confounding With Negative Controls: A
Minimax Learning Approach [84.29777236590674]
すべての共同設立者が観察されず、代わりに負の制御が利用可能である場合の因果パラメータの推定について検討する。
最近の研究は、2つのいわゆるブリッジ関数による同定と効率的な推定を可能にする方法を示している。
論文 参考訳(メタデータ) (2021-03-25T17:59:19Z) - CoinDICE: Off-Policy Confidence Interval Estimation [107.86876722777535]
強化学習における高信頼行動非依存のオフ政治評価について検討する。
様々なベンチマークにおいて、信頼区間推定が既存の手法よりも厳密で精度が高いことが示されている。
論文 参考訳(メタデータ) (2020-10-22T12:39:11Z) - Refined bounds for algorithm configuration: The knife-edge of dual class
approximability [94.83809668933021]
トレーニングセットが、トレーニングセット上でのパラメータの平均メトリックのパフォーマンスが、予想される将来的なパフォーマンスに最も近いことを保証するために、どの程度の規模が必要かを調査する。
この近似が L-無限ノルムの下で成り立つなら、強いサンプル複雑性境界を与えることができる。
我々は、コンピュータ科学において最も強力なツールの一つである整数プログラミングの文脈において、我々の限界を実証的に評価する。
論文 参考訳(メタデータ) (2020-06-21T15:32:21Z) - Differentiable Linear Bandit Algorithm [6.849358422233866]
アッパー信頼境界は、線形多腕バンディット問題の最も一般的な方法である。
勾配上昇による信頼度を学習できる勾配推定器を導入する。
提案アルゴリズムは,腕の特徴の次元を$d$で,信頼度を$hatbeta$で学習したサイズを$tildemathcalO(hatbetasqrtdT)$上限とする。
論文 参考訳(メタデータ) (2020-06-04T16:43:55Z) - Optimal Confidence Regions for the Multinomial Parameter [15.851891538566585]
厳密な信頼領域とインターバルの構築は、統計的推測と意思決定の中心である。
本稿では,カテゴリデータに対する最小平均体積信頼領域を示す新しい理論を開発する。
論文 参考訳(メタデータ) (2020-02-03T23:00:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。