論文の概要: DeepSampling: Selectivity Estimation with Predicted Error and Response
Time
- arxiv url: http://arxiv.org/abs/2008.06831v1
- Date: Sun, 16 Aug 2020 03:23:01 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-28 12:08:17.093902
- Title: DeepSampling: Selectivity Estimation with Predicted Error and Response
Time
- Title(参考訳): deepsampling: 予測誤差と応答時間による選択性推定
- Authors: Tin Vu, Ahmed Eldawy
- Abstract要約: 本稿では,サンプルベースAQPアルゴリズムの精度を予測するディープラーニングモデルであるDeepSamplingを提案する。
DeepSamplingは、既存の空間データベースがAQPの精度を制御するための信頼性の高いツールを提供する最初のシステムである。
- 参考スコア(独自算出の注目度): 7.23389716633927
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The rapid growth of spatial data urges the research community to find
efficient processing techniques for interactive queries on large volumes of
data. Approximate Query Processing (AQP) is the most prominent technique that
can provide real-time answer for ad-hoc queries based on a random sample.
Unfortunately, existing AQP methods provide an answer without providing any
accuracy metrics due to the complex relationship between the sample size, the
query parameters, the data distribution, and the result accuracy. This paper
proposes DeepSampling, a deep-learning-based model that predicts the accuracy
of a sample-based AQP algorithm, specially selectivity estimation, given the
sample size, the input distribution, and query parameters. The model can also
be reversed to measure the sample size that would produce a desired accuracy.
DeepSampling is the first system that provides a reliable tool for existing
spatial databases to control the accuracy of AQP.
- Abstract(参考訳): 空間データの急速な成長は,大量のデータに対する対話型クエリの効率的な処理手法を研究コミュニティに求める。
Approximate Query Processing (AQP)は、ランダムなサンプルに基づいて、アドホックなクエリに対してリアルタイムに応答する技術である。
残念なことに、既存のaqpメソッドは、サンプルサイズ、クエリパラメータ、データ分布、結果精度の間の複雑な関係のために、正確なメトリックを提供することなく答えを提供する。
本稿では,サンプルサイズ,入力分布,クエリパラメータを考慮し,サンプルベースAQPアルゴリズムの精度を予測するディープラーニングモデルであるDeepSamplingを提案する。
モデルはまた、望ましい精度を生み出すサンプルサイズを測定するために反転することもできる。
DeepSamplingは、既存の空間データベースがAQPの精度を制御するための信頼性の高いツールを提供する最初のシステムである。
関連論文リスト
- Bayesian Estimation and Tuning-Free Rank Detection for Probability Mass Function Tensors [17.640500920466984]
本稿では,関節のPMFを推定し,そのランクを観測データから自動的に推定する新しい枠組みを提案する。
我々は、様々なモデルパラメータの後方分布を近似するために、変分推論(VI)に基づく決定論的解を導出し、さらに、変分推論(SVI)を利用して、VVIベースのアプローチのスケーラブルバージョンを開発する。
合成データと実映画レコメンデーションデータの両方を含む実験は、推定精度、自動ランク検出、計算効率の点で、VVIおよびSVIベースの手法の利点を示している。
論文 参考訳(メタデータ) (2024-10-08T20:07:49Z) - Stratified Prediction-Powered Inference for Hybrid Language Model Evaluation [62.2436697657307]
予測駆動推論(英: Prediction-powered Inference, PPI)は、人間ラベル付き限られたデータに基づいて統計的推定を改善する手法である。
我々はStratPPI(Stratified Prediction-Powered Inference)という手法を提案する。
単純なデータ階層化戦略を用いることで,基礎的なPPI推定精度を大幅に向上できることを示す。
論文 参考訳(メタデータ) (2024-06-06T17:37:39Z) - Query Performance Prediction using Relevance Judgments Generated by Large Language Models [53.97064615557883]
自動生成関連判定(QPP-GenRE)を用いたQPPフレームワークを提案する。
QPP-GenREは、QPPを独立したサブタスクに分解し、ランクリスト内の各項目の関連性を所定のクエリに予測する。
これにより、生成した関連判断を擬似ラベルとして利用して、任意のIR評価尺度を予測することができる。
論文 参考訳(メタデータ) (2024-04-01T09:33:05Z) - SEAM: Searching Transferable Mixed-Precision Quantization Policy through
Large Margin Regularization [50.04951511146338]
混合精度量子化(MPQ)は各層に対して最適なビット幅割り当てを求めるのに時間を要する。
本稿では,小規模なプロキシデータセットを用いて効率的なMPQポリシーを効率的に検索する手法を提案する。
論文 参考訳(メタデータ) (2023-02-14T05:47:45Z) - Approximate Gibbs Sampler for Efficient Inference of Hierarchical Bayesian Models for Grouped Count Data [0.0]
本研究は、推定精度を維持しつつ、HBPRMを効率的に学習するための近似ギブスサンプリング器(AGS)を開発した。
実データと合成データを用いた数値実験により,AGSの優れた性能を示した。
論文 参考訳(メタデータ) (2022-11-28T21:00:55Z) - Approximate Query Processing for Group-By Queries based on Conditional
Generative Models [3.9837198605506963]
グループバイクエリには複数の値が含まれるため、すべてのグループに対して十分な正確な推定を行うのは難しい。
階層化サンプリングは、一様サンプリングに比べて精度が向上するが、特定のクエリで選択されたサンプルは他のクエリでは動作しない。
オンラインサンプリングは、クエリ時に与えられたクエリのサンプルを選択するが、長いレイテンシを必要とする。
提案フレームワークは階層化サンプリングとオンラインアグリゲーションを組み合わせることで,グループバイクエリの推定精度を向上させることができる。
論文 参考訳(メタデータ) (2021-01-08T08:49:21Z) - APQ: Joint Search for Network Architecture, Pruning and Quantization
Policy [49.3037538647714]
本稿では,リソース制約のあるハードウェア上での効率的なディープラーニング推論のためのAPQを提案する。
ニューラルアーキテクチャ、プルーニングポリシー、量子化ポリシーを別々に検索する従来の方法とは異なり、我々はそれらを共同で最適化する。
同じ精度で、APQはMobileNetV2+HAQよりもレイテンシ/エネルギーを2倍/1.3倍削減する。
論文 参考訳(メタデータ) (2020-06-15T16:09:17Z) - PyODDS: An End-to-end Outlier Detection System with Automated Machine
Learning [55.32009000204512]
PyODDSは、データベースサポート付きアウトレイラ検出のための、エンドツーエンドのPythonシステムである。
具体的には,探索空間を外乱検出パイプラインで定義し,与えられた探索空間内で探索戦略を作成する。
また、データサイエンスや機械学習のバックグラウンドの有無に関わらず、統一されたインターフェイスと視覚化を提供する。
論文 参考訳(メタデータ) (2020-03-12T03:30:30Z) - LAQP: Learning-based Approximate Query Processing [5.249017312277057]
近似クエリ処理(AQP)は、迅速な応答の要求を満たす方法である。
LAQPと呼ばれる学習に基づくAQP手法を提案する。
履歴クエリから学習したエラーモデルを構築し、新しいクエリ毎にサンプリングベースの推定エラーを予測する。
論文 参考訳(メタデータ) (2020-03-05T06:08:25Z) - Uncertainty Estimation Using a Single Deep Deterministic Neural Network [66.26231423824089]
本稿では,1回のフォワードパスで,テスト時に分布データポイントの発見と拒否が可能な決定論的ディープモデルを訓練する手法を提案する。
我々は,新しい損失関数とセントロイド更新方式を用いて,これらをスケールトレーニングし,ソフトマックスモデルの精度に適合させる。
論文 参考訳(メタデータ) (2020-03-04T12:27:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。