Fugu-MT 論文翻訳(概要): Non-Adaptive Adaptive Sampling on Turnstile Streams

論文の概要: Non-Adaptive Adaptive Sampling on Turnstile Streams

arxiv url: http://arxiv.org/abs/2004.10969v1
Date: Thu, 23 Apr 2020 05:00:21 GMT
ステータス: 翻訳完了
システム内更新日: 2022-12-10 12:46:21.175151
Title: Non-Adaptive Adaptive Sampling on Turnstile Streams
Title（参考訳）: 旋回性流れにおける非適応適応サンプリング
Authors: Sepideh Mahabadi, Ilya Razenshteyn, David P. Woodruff, Samson Zhou
Abstract要約: カラムサブセット選択、部分空間近似、射影クラスタリング、および空間サブリニアを$n$で使用するターンタイルストリームのボリュームに対する最初の相対エラーアルゴリズムを提供する。我々の適応的なサンプリング手法は、様々なデータ要約問題に多くの応用をもたらしており、これは最先端を改善するか、より緩和された行列列モデルで以前に研究されただけである。
参考スコア（独自算出の注目度）: 57.619901304728366
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Adaptive sampling is a useful algorithmic tool for data summarization problems in the classical centralized setting, where the entire dataset is available to the single processor performing the computation. Adaptive sampling repeatedly selects rows of an underlying matrix $\mathbf{A}\in\mathbb{R}^{n\times d}$, where $n\gg d$, with probabilities proportional to their distances to the subspace of the previously selected rows. Intuitively, adaptive sampling seems to be limited to trivial multi-pass algorithms in the streaming model of computation due to its inherently sequential nature of assigning sampling probabilities to each row only after the previous iteration is completed. Surprisingly, we show this is not the case by giving the first one-pass algorithms for adaptive sampling on turnstile streams and using space $\text{poly}(d,k,\log n)$, where $k$ is the number of adaptive sampling rounds to be performed. Our adaptive sampling procedure has a number of applications to various data summarization problems that either improve state-of-the-art or have only been previously studied in the more relaxed row-arrival model. We give the first relative-error algorithms for column subset selection, subspace approximation, projective clustering, and volume maximization on turnstile streams that use space sublinear in $n$. We complement our volume maximization algorithmic results with lower bounds that are tight up to lower order terms, even for multi-pass algorithms. By a similar construction, we also obtain lower bounds for volume maximization in the row-arrival model, which we match with competitive upper bounds. See paper for full abstract.
Abstract（参考訳）: アダプティブサンプリング(Adaptive sample)は、古典的な中央集権的な設定におけるデータ要約問題に対して有用なアルゴリズムツールである。アダプティブサンプリングは、下層の行列 $\mathbf{A}\in\mathbb{R}^{n\times d}$ の行を繰り返し選択する。直感的には、アダプティブサンプリングは、前回の繰り返しが完了した後のみ、各行にサンプリング確率を割り当てるという本質的にシーケンシャルな性質から、計算のストリーミングモデルにおける自明なマルチパスアルゴリズムに制限されているようである。驚くべきことに、ターンタイルストリーム上で適応サンプリングを行うための最初のワンパスアルゴリズムを与え、スペース$\text{poly}(d,k,\log n)$を使用すると、$k$は適応サンプリングラウンドの回数である。適応サンプリング法では,データ要約問題に対する応用が多岐に渡り,最新技術の改善か,従来より緩和された行配列モデルでのみ研究されてきた。空間サブリニアを$n$で使用するターンタイルストリームに対して、カラムサブセット選択、部分空間近似、射影クラスタリング、ボリューム最大化のための最初の相対エラーアルゴリズムを提供する。我々は,マルチパスアルゴリズムにおいても,低次項まで厳密な境界を持つボリューム最大化アルゴリズムを補完する。また、同様の構成により、競合上界と一致する行-アリーモデルにおける体積最大化のための下限を得る。完全な要約は紙を参照。

関連論文リスト

Scalable Subset Selection in Linear Mixed Models [0.39373541926236766]
リニアモデル(LMM)は、パーソナライズドメディカルのような異種データを分析するための重要なツールである。 LMMの既存の手法は、数十から数百の予測値を超えない。 LMMサブセット選択の新しい方法は、数千の予測器を数秒から数分で含むデータセット上で実行できる。
論文参考訳（メタデータ） (2025-06-25T13:39:30Z)
Parallel Simulation for Log-concave Sampling and Score-based Diffusion Models [55.07411490538404]
本稿では,次元$d$の適応的複雑性依存性を改善する並列サンプリング手法を提案する。我々の手法は科学計算による並列シミュレーション技術に基づいている。
論文参考訳（メタデータ） (2024-12-10T11:50:46Z)
A Sample Efficient Alternating Minimization-based Algorithm For Robust Phase Retrieval [56.67706781191521]
そこで本研究では,未知の信号の復元を課題とする,ロバストな位相探索問題を提案する。提案するオラクルは、単純な勾配ステップと外れ値を用いて、計算学的スペクトル降下を回避している。
論文参考訳（メタデータ） (2024-09-07T06:37:23Z)
Bayes-optimal learning of an extensive-width neural network from quadratically many samples [28.315491743569897]
本研究では,単一層ニューラルネットワークに対応する対象関数を学習する問題を考察する。入力次元とネットワーク幅が比例的に大きい限界を考える。
論文参考訳（メタデータ） (2024-08-07T12:41:56Z)
Stochastic Optimization Algorithms for Instrumental Variable Regression with Streaming Data [17.657917523817243]
この問題を条件付き最適化問題とみなして,器用変分回帰のためのアルゴリズムを開発し,解析する。最小二乗変数回帰の文脈では、我々のアルゴリズムは行列逆転やミニバッチを必要としない。任意の$iota>0$に対して$mathcalO(log T/T)$と$mathcalO(1/T1-iota)$の順の収束率を導出する。
論文参考訳（メタデータ） (2024-05-29T19:21:55Z)
Proximal Oracles for Optimization and Sampling [18.77973093341588]
非滑らかな目的関数による凸最適化と非滑らかなポテンシャルによる対数凹型サンプリングについて検討する。非滑らか性による課題を克服するため、アルゴリズムは最適化とサンプリングに2つの強力な近位フレームワークを用いる。
論文参考訳（メタデータ） (2024-04-02T18:52:28Z)
Best Policy Identification in Linear MDPs [70.57916977441262]
縮退した線形マルコフ+デルタ決定における最適同定問題について, 生成モデルに基づく固定信頼度設定における検討を行った。複雑な非最適化プログラムの解としての下位境界は、そのようなアルゴリズムを考案する出発点として用いられる。
論文参考訳（メタデータ） (2022-08-11T04:12:50Z)
Adaptive Sketches for Robust Regression with Importance Sampling [64.75899469557272]
我々は、勾配降下(SGD)による頑健な回帰を解くためのデータ構造を導入する。我々のアルゴリズムは、サブ線形空間を使用し、データに1回パスするだけで、SGDの$T$ステップを重要サンプリングで効果的に実行します。
論文参考訳（メタデータ） (2022-07-16T03:09:30Z)
Langevin Monte Carlo for Contextual Bandits [72.00524614312002]
Langevin Monte Carlo Thompson Sampling (LMC-TS) が提案されている。提案アルゴリズムは,文脈的帯域幅の特別な場合において,最高のトンプソンサンプリングアルゴリズムと同じサブ線形残差を達成できることを示す。
論文参考訳（メタデータ） (2022-06-22T17:58:23Z)
Towards Sample-Optimal Compressive Phase Retrieval with Sparse and Generative Priors [59.33977545294148]
O(k log L)$サンプルは振幅に基づく経験損失関数を最小化する任意のベクトルに信号が近いことを保証するのに十分であることを示す。この結果はスパース位相検索に適応し、基底信号が$s$-sparseおよび$n$-dimensionalである場合、$O(s log n)$サンプルは同様の保証に十分であることを示す。
論文参考訳（メタデータ） (2021-06-29T12:49:54Z)
Distributed Adaptive Nearest Neighbor Classifier: Algorithm and Theory [6.696267547013535]
そこで本研究では,データ駆動基準によりパラメータ選択された,近接する隣人の数がパラメータとなる分散適応型NN分類器を提案する。有限標本性能を向上する最適チューニングパラメータを探索する際,早期停止規則を提案する。特に、サブサンプルサイズが十分に大きい場合、提案した分類器がほぼ最適な収束率を達成することを示す。
論文参考訳（メタデータ） (2021-05-20T14:38:41Z)
Optimal Sampling Gaps for Adaptive Submodular Maximization [28.24164217929491]
アダプティブサブモジュラの文脈における確率サンプリングによる性能損失について検討する。ポリシワイズ・サブモジュラの性質は、現実世界の幅広いアプリケーションで見つけることができることを示しています。
論文参考訳（メタデータ） (2021-04-05T03:21:32Z)
Adaptive Sequential SAA for Solving Two-stage Stochastic Linear Programs [1.6181085766811525]
大規模2段階線形プログラムを解くための適応的逐次SAA(sample average approximation)アルゴリズムを提案する。提案アルゴリズムは,品質の確率論的保証が与えられた解を返すために,有限時間で停止することができる。
論文参考訳（メタデータ） (2020-12-07T14:58:16Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。