論文の概要: BayesCard: Revitilizing Bayesian Frameworks for Cardinality Estimation
- arxiv url: http://arxiv.org/abs/2012.14743v2
- Date: Tue, 2 Feb 2021 10:54:33 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-18 20:28:24.975794
- Title: BayesCard: Revitilizing Bayesian Frameworks for Cardinality Estimation
- Title(参考訳): bayescard: 濃度推定のためのベイズフレームワークの復活
- Authors: Ziniu Wu, Amir Shaikhha, Rong Zhu, Kai Zeng, Yuxing Han, Jingren Zhou
- Abstract要約: 望ましいCardEstメソッドは、優れたアルゴリズム性能を達成し、さまざまなデータ設定に安定し、システムデプロイメントに親しみやすくする必要がある。
BayesCardはBNの利点、すなわち高い推定精度と解釈可能性を引き継ぐ最初のフレームワークである。
同等かそれ以上の精度,1-2桁の高速化,1-3桁のトレーニング時間,1-3桁のモデルサイズ,1-2桁の高速更新を実現している。
- 参考スコア(独自算出の注目度): 25.871965040723772
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Cardinality estimation (CardEst) is an essential component in query
optimizers and a fundamental problem in DBMS. A desired CardEst method should
attain good algorithm performance, be stable to varied data settings, and be
friendly to system deployment. However, no existing CardEst method can fulfill
the three criteria at the same time. Traditional methods often have significant
algorithm drawbacks such as large estimation errors. Recently proposed deep
learning based methods largely improve the estimation accuracy but their
performance can be greatly affected by data and often difficult for system
deployment.
In this paper, we revitalize the Bayesian networks (BN) for CardEst by
incorporating the techniques of probabilistic programming languages. We present
BayesCard, the first framework that inherits the advantages of BNs, i.e., high
estimation accuracy and interpretability, while overcomes their drawbacks, i.e.
low structure learning and inference efficiency. This makes BayesCard a perfect
candidate for commercial DBMS deployment. Our experimental results on several
single-table and multi-table benchmarks indicate BayesCard's superiority over
existing state-of-the-art CardEst methods: BayesCard achieves comparable or
better accuracy, 1-2 orders of magnitude faster inference time, 1-3 orders
faster training time, 1-3 orders smaller model size, and 1-2 orders faster
updates. Meanwhile, BayesCard keeps stable performance when varying data with
different settings. We also deploy BayesCard into PostgreSQL. On the IMDB
benchmark workload, it improves the end-to-end query time by 13.3%, which is
very close to the optimal result of 14.2% using an oracle of true cardinality.
- Abstract(参考訳): 基数推定(cardest)はクエリオプティマイザの重要な要素であり、dbmsの基本的な問題である。
望ましいCardEstメソッドは、優れたアルゴリズム性能を達成し、さまざまなデータ設定に安定し、システムデプロイメントに親しみやすくする必要がある。
しかし、既存のCardEstメソッドでは同時に3つの基準を満たすことはできない。
従来の手法では、大きな推定誤差のような大きなアルゴリズムの欠点があることが多い。
最近提案されたディープラーニングに基づく手法は推定精度を大幅に改善するが、その性能はデータに大きく影響され、システム展開にはしばしば困難である。
本稿では,確率的プログラミング言語の技法を取り入れて,CardEstのベイズネットワーク(BN)を再活性化する。
我々は、BNの利点、すなわち高い推定精度と解釈可能性を継承する最初のフレームワークであるBayesCardを紹介し、その欠点、すなわちその欠点を克服する。
低い構造学習と推論効率です
これにより、BayesCardは商用DBMSデプロイメントの完璧な候補となる。
bayescardは、同等かそれ以上の精度、桁違いに速い推論時間、1-3桁のトレーニング時間、1-3桁の小さなモデルサイズ、1-2桁の高速なアップデートを実現しています。
一方、BayesCardは、異なる設定でデータを変更した場合、安定したパフォーマンスを維持する。
BayesCardもPostgreSQLにデプロイしています。
IMDBベンチマークのワークロードでは、エンドツーエンドのクエリ時間を13.3%改善し、真の濃度のオラクルを使用して14.2%の最適な結果に非常に近い。
関連論文リスト
- CardBench: A Benchmark for Learned Cardinality Estimation in Relational Databases [17.46316633654637]
データベースにおける高いクエリパフォーマンスを実現するには、心臓病推定が不可欠である。
研究者が新しい学習アプローチによる進捗を評価することができるような、体系的なベンチマークやデータセットは存在しない。
我々は,20の異なる実世界のデータベースに数千のクエリを格納したベンチマークを,学習された濃度推定のためにリリースした。
論文 参考訳(メタデータ) (2024-08-28T23:25:25Z) - PRICE: A Pretrained Model for Cross-Database Cardinality Estimation [78.30959470441442]
クエリ実行計画の最適化には,カーディナリティ推定(CardEst)が不可欠である。
近年のMLベースのCardEst法は, 製造コストが高いため, 高い精度で展開が困難である。
PRetrained MultI-table CardEstモデルであるPRICEを提案する。
論文 参考訳(メタデータ) (2024-06-03T06:21:53Z) - Lero: A Learning-to-Rank Query Optimizer [49.841082217997354]
これは、ネイティブクエリの上に構築され、クエリ最適化を改善するために継続的に学習される。
Leroはスクラッチから学習を構築するのではなく、数十年にわたるデータベースの知恵を活用し、ネイティブ性を改善するように設計されている。
Leroはいくつかのベンチマークでほぼ最適なパフォーマンスを達成する。
論文 参考訳(メタデータ) (2023-02-14T07:31:11Z) - Efficient Few-Shot Object Detection via Knowledge Inheritance [62.36414544915032]
Few-shot Object Detection (FSOD) は、未確認のタスクに少ないトレーニングサンプルで適応できるジェネリック検出器を学習することを目的としている。
計算量の増加を伴わない効率的なプレトレイン・トランスファー・フレームワーク(PTF)のベースラインを提案する。
また,予測された新しいウェイトと事前訓練されたベースウェイトとのベクトル長の不整合を軽減するために,適応長再スケーリング(ALR)戦略を提案する。
論文 参考訳(メタデータ) (2022-03-23T06:24:31Z) - Glue: Adaptively Merging Single Table Cardinality to Estimate Join Query
Size [35.1093718746362]
カーディナリティ推定(CardEst)は、高品質なクエリプランを生成する上で重要な役割を果たす。
CardEstの最も難しい問題、すなわち、複数のテーブル上でジョインクエリサイズを推定する方法は、広く解決されていない。
本稿では,テーブル単位のCardEst結果をサポートするGlueという,非常に一般的なフレームワークを提案する。
論文 参考訳(メタデータ) (2021-12-07T02:46:46Z) - Cardinality Estimation in DBMS: A Comprehensive Benchmark Evaluation [43.27881697012329]
カーディナリティ推定(CardEst)は、クエリワークロードの高品質なクエリプランを生成する上で重要な役割を果たす。
本稿では,実際のデータセットにおけるCardEst手法の有効性を包括的かつ体系的に比較する。
我々はCardEstの新しいベンチマークを構築し、それは新しい複雑な現実世界STATSと多様なクエリSTATS-CEBを含んでいる。
論文 参考訳(メタデータ) (2021-09-13T11:25:02Z) - FLAT: Fast, Lightweight and Accurate Method for Cardinality Estimation [45.98791307420517]
確率計算の高速化とグラフィカルモデルサイズの軽量化,推定精度の向上を実現したCardEst法であるFLATを提案する。
FLATは、基礎となるFSPNモデル上で、ほぼ線形時間で効率的なオンライン確率計算をサポートする。
単一のテーブルクエリとマルチテーブルジョインクエリの両方の濃度を推定できる。
1〜5桁の精度、1〜3桁の確率速度、1~2桁のストレージコストを実現する。
論文 参考訳(メタデータ) (2020-11-18T01:14:45Z) - The Right Tool for the Job: Matching Model and Instance Complexities [62.95183777679024]
NLPモデルが大きくなればなるほど、訓練されたモデルを実行するには、金銭的・環境的なコストを発生させる重要な計算資源が必要である。
我々は、推論中、早期(かつ高速)の"exit"を可能にする文脈表現微調整の修正を提案する。
3つのテキスト分類データセットと2つの自然言語推論ベンチマークの2つのタスクで、5つの異なるデータセットに対して提案した修正を検証した。
論文 参考訳(メタデータ) (2020-04-16T04:28:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。