論文の概要: Efficient Quantile Tracking Using an Oracle
- arxiv url: http://arxiv.org/abs/2004.12588v1
- Date: Mon, 27 Apr 2020 05:49:05 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-09 06:07:51.126750
- Title: Efficient Quantile Tracking Using an Oracle
- Title(参考訳): Oracleによる効率的な量子トラッキング
- Authors: Hugo L. Hammer, Anis Yazidi, Michael A. Riegler and H{\aa}vard Rue
- Abstract要約: 現在の追跡平均二乗誤差(MSE)を推定する2つの新しい手順が提示される。
プロシージャのメモリフットプリントは8L$で、計算複雑性は1イテレーションあたり8L$である。
実験により、手順は非常に効率的であることが示され、理論的な最適値に近い誤差で量子化を追跡できる。
- 参考スコア(独自算出の注目度): 6.166073446666975
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: For incremental quantile estimators the step size and possibly other tuning
parameters must be carefully set. However, little attention has been given on
how to set these values in an online manner. In this article we suggest two
novel procedures that address this issue.
The core part of the procedures is to estimate the current tracking mean
squared error (MSE). The MSE is decomposed in tracking variance and bias and
novel and efficient procedures to estimate these quantities are presented. It
is shown that estimation bias can be tracked by associating it with the portion
of observations below the quantile estimates.
The first procedure runs an ensemble of $L$ quantile estimators for wide
range of values of the tuning parameters and typically around $L = 100$. In
each iteration an oracle selects the best estimate by the guidance of the
estimated MSEs. The second method only runs an ensemble of $L = 3$ estimators
and thus the values of the tuning parameters need from time to time to be
adjusted for the running estimators. The procedures have a low memory foot
print of $8L$ and a computational complexity of $8L$ per iteration.
The experiments show that the procedures are highly efficient and track
quantiles with an error close to the theoretical optimum. The Oracle approach
performs best, but comes with higher computational cost. The procedures were
further applied to a massive real-life data stream of tweets and proofed real
world applicability of them.
- Abstract(参考訳): インクリメンタル量子推定器では、ステップサイズや他のチューニングパラメータを慎重に設定する必要がある。
しかし、これらの価値をどのようにオンラインに設定するかにはほとんど注意が払われていない。
本稿ではこの問題に対処する2つの新しい手順を提案する。
手順の中核となる部分は、現在の追跡平均二乗誤差(MSE)を推定することである。
MSEは分散とバイアスの追跡において分解され、これらの量を推定する新規で効率的な手順が提示される。
その結果, 推定バイアスは, 量的推定値以下の観測部分と関連付けることで追跡できることがわかった。
最初の手順は、チューニングパラメータの幅広い値と典型的には約$l = 100$に対して、$l$ quantile estimatorのアンサンブルを実行する。
各イテレーションにおいて、オラクルは推定されたMSEのガイダンスによって最良の見積もりを選択する。
第2の方法は、$l = 3$の推定値のみを実行するため、チューニングパラメータの値は、実行中の推定値に調整される時間によって必要となる。
プロシージャのメモリフットプリントは8l$で、計算の複雑さは1イテレーションあたり8l$である。
実験の結果、手順は非常に効率的で、理論上の最適値に近い誤差で量子を追跡できることがわかった。
Oracleのアプローチは最高に機能するが、高い計算コストが伴う。
この手順は、ツイートの膨大なリアルタイムデータストリームに適用され、それらの実世界の適用性を証明する。
関連論文リスト
- Active Subsampling for Measurement-Constrained M-Estimation of Individualized Thresholds with High-Dimensional Data [3.1138411427556445]
測定制約のある問題では、大きなデータセットが利用可能であるにもかかわらず、大きなデータセットのごく一部でラベルを観測するのに手頃な価格にしかならない。
このことは、どのデータポイントが予算制約のあるラベルに最も有益であるかという重要な疑問を引き起こします。
本稿では,測定制約付きM推定フレームワークにおける最適個別化しきい値の推定に焦点をあてる。
論文 参考訳(メタデータ) (2024-11-21T00:21:17Z) - Efficient Learning of POMDPs with Known Observation Model in Average-Reward Setting [56.92178753201331]
我々は,POMDPパラメータを信念に基づくポリシを用いて収集したサンプルから学習することのできる観測・認識スペクトル(OAS)推定手法を提案する。
提案するOAS-UCRLアルゴリズムに対して,OASプロシージャの整合性を示し,$mathcalO(sqrtT log(T)$の残差保証を証明した。
論文 参考訳(メタデータ) (2024-10-02T08:46:34Z) - Scaling Sparse Fine-Tuning to Large Language Models [67.59697720719672]
大きな言語モデル(LLM)は、パラメータの数が多いため、完全な微調整が難しい。
本研究では,パラメータの配列とパラメータのデルタを事前学習した値に対して保持する新しいスパース微調整法SpIELを提案する。
提案手法は,LoRAのようなパラメータ効率の高い微調整法よりも性能が優れ,実行時間も同等であることを示す。
論文 参考訳(メタデータ) (2024-01-29T18:43:49Z) - Bayes beats Cross Validation: Efficient and Accurate Ridge Regression
via Expectation Maximization [3.061662434597098]
本稿では,正規化ハイパーパラメータである$lambda$について,LOOCV(Left-out-out Cross-validation)よりも高速に計算できる手法を提案する。
提案手法は,比較的穏やかな条件下で,十分大きな$n$に対して,一意の最適解を求めることが保証されている。
論文 参考訳(メタデータ) (2023-10-29T01:13:55Z) - A Specialized Semismooth Newton Method for Kernel-Based Optimal
Transport [92.96250725599958]
カーネルベース最適輸送(OT)推定器は、サンプルからOT問題に対処するための代替的機能的推定手順を提供する。
SSN法は, 標準正規性条件下でのグローバル収束率$O (1/sqrtk)$, 局所二次収束率を達成できることを示す。
論文 参考訳(メタデータ) (2023-10-21T18:48:45Z) - Multiply Robust Estimator Circumvents Hyperparameter Tuning of Neural
Network Models in Causal Inference [0.0]
乗算ロバスト (MR) 推定器は1つの推定器で全ての第一段階モデルを活用できる。
MR は方程式の幅広いクラスの解であり、処理モデルの一つが $sqrtn$ consistent であれば一貫した値であることを示す。
論文 参考訳(メタデータ) (2023-07-20T02:31:12Z) - Development and Demonstration of an Efficient Readout Error Mitigation
Technique for use in NISQ Algorithms [2.1279211992135068]
リゲッティ量子コンピューティングハードウェア上での読み出し緩和期待値の近似状態推定について検討する。
相関誤差の影響を抑えることができ、読み出し誤差を正確に軽減できることを示す。
この開発は、この種のランダム化によるメソッドの実践的利用の道を開く。
論文 参考訳(メタデータ) (2023-03-30T23:29:13Z) - Nearly Minimax Optimal Reinforcement Learning for Linear Markov Decision
Processes [80.89852729380425]
そこで本研究では,最小限の最小残差である$tilde O(dsqrtH3K)$を計算効率よく実現したアルゴリズムを提案する。
我々の研究は線形 MDP を用いた最適 RL に対する完全な答えを提供する。
論文 参考訳(メタデータ) (2022-12-12T18:58:59Z) - Active Sampling of Multiple Sources for Sequential Estimation [92.37271004438406]
本研究の目的は,パラメータを逐次推定するアクティブサンプリングアルゴリズムを設計し,信頼性の高い推定値を生成することである。
本稿では, エンフ条件推定コスト関数を導入し, 最近, トラクタブル解析を施した逐次推定手法を提案する。
論文 参考訳(メタデータ) (2022-08-10T15:58:05Z) - Debiasing Distributed Second Order Optimization with Surrogate Sketching
and Scaled Regularization [101.5159744660701]
分散第2次最適化において、標準的な戦略は、データの小さなスケッチやバッチに基づいて、多くの局所的な見積もりを平均化することである。
本稿では,分散二階法における収束率の理論的および実証的改善を両立させるため,局所的な推定を嫌悪する新しい手法を提案する。
論文 参考訳(メタデータ) (2020-07-02T18:08:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。