論文の概要: Scardina: Scalable Join Cardinality Estimation by Multiple Density
Estimators
- arxiv url: http://arxiv.org/abs/2303.18042v1
- Date: Fri, 31 Mar 2023 13:22:28 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-03 13:54:25.748925
- Title: Scardina: Scalable Join Cardinality Estimation by Multiple Density
Estimators
- Title(参考訳): scardina: 複数密度推定器によるスケーラブル結合濃度推定
- Authors: Ryuichi Ito, Yuya Sasaki, Chuan Xiao, Makoto Onizuka
- Abstract要約: 機械学習に基づく濃度推定手法が従来の手法に取って代わっている。
スキーマ構造に基づく分割モデルを用いた新しい結合濃度推定法であるScardinaを提案する。
- 参考スコア(独自算出の注目度): 8.641606056228675
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In recent years, machine learning-based cardinality estimation methods are
replacing traditional methods. This change is expected to contribute to one of
the most important applications of cardinality estimation, the query optimizer,
to speed up query processing. However, none of the existing methods do not
precisely estimate cardinalities when relational schemas consist of many tables
with strong correlations between tables/attributes. This paper describes that
multiple density estimators can be combined to effectively target the
cardinality estimation of data with large and complex schemas having strong
correlations. We propose Scardina, a new join cardinality estimation method
using multiple partitioned models based on the schema structure.
- Abstract(参考訳): 近年,機械学習に基づく濃度推定手法が従来の手法に置き換わっている。
この変更は、クエリ処理を高速化するために、濃度推定の最も重要なアプリケーションであるクエリオプティマイザに寄与することが期待されている。
しかし、関係スキーマがテーブル/属性間の強い相関を持つ多数のテーブルからなる場合、既存の手法では、基数を正確に見積もることができない。
本稿では,複数の密度推定器を組み合わせることで,強い相関関係を持つ大規模かつ複雑なスキーマを用いたデータの濃度推定を効果的に行うことができることを示す。
スキーマ構造に基づく複数の分割モデルを用いた新しい結合濃度推定法であるscardinaを提案する。
関連論文リスト
- CardBench: A Benchmark for Learned Cardinality Estimation in Relational Databases [17.46316633654637]
データベースにおける高いクエリパフォーマンスを実現するには、心臓病推定が不可欠である。
研究者が新しい学習アプローチによる進捗を評価することができるような、体系的なベンチマークやデータセットは存在しない。
我々は,20の異なる実世界のデータベースに数千のクエリを格納したベンチマークを,学習された濃度推定のためにリリースした。
論文 参考訳(メタデータ) (2024-08-28T23:25:25Z) - MAP: Low-compute Model Merging with Amortized Pareto Fronts via Quadratic Approximation [80.47072100963017]
Amortized Pareto Front (MAP) を用いた新しい低演算アルゴリズム Model Merging を導入する。
MAPは、複数のモデルをマージするためのスケーリング係数のセットを効率的に識別し、関連するトレードオフを反映する。
また,タスク数が比較的少ないシナリオではベイジアンMAP,タスク数の多い状況ではNested MAPを導入し,計算コストを削減した。
論文 参考訳(メタデータ) (2024-06-11T17:55:25Z) - Deep Negative Correlation Classification [82.45045814842595]
既存のディープアンサンブル手法は、多くの異なるモデルをナビゲートし、予測を集約する。
深部負相関分類(DNCC)を提案する。
DNCCは、個々の推定器が正確かつ負の相関を持つ深い分類アンサンブルを生成する。
論文 参考訳(メタデータ) (2022-12-14T07:35:20Z) - FactorJoin: A New Cardinality Estimation Framework for Join Queries [35.22928513918166]
カーディナリティ推定は、クエリ最適化における最も根本的で難しい問題の1つである。
結合クエリを推定する新しいフレームワークであるFacterJoinを提案する。
評価において、FacterJoinは従来の最先端の学習手法よりも効果的に推定できる。
論文 参考訳(メタデータ) (2022-12-11T15:51:39Z) - Mining Relations among Cross-Frame Affinities for Video Semantic
Segmentation [87.4854250338374]
関連性間の関係を, 単一スケールの内在的相関と多スケールの関係という2つの側面で検討する。
実験により,提案手法は最先端のVSS法に対して好適に動作することを示した。
論文 参考訳(メタデータ) (2022-07-21T12:12:36Z) - Proton: Probing Schema Linking Information from Pre-trained Language
Models for Text-to-SQL Parsing [66.55478402233399]
本稿では,ポアンカー距離測定に基づく探索手法を用いて,関係構造を抽出する枠組みを提案する。
スキーマリンクの一般的なルールベース手法と比較して,探索関係は意味的対応をしっかりと捉えることができることがわかった。
我々のフレームワークは3つのベンチマークで最先端のパフォーマンスを新たに設定する。
論文 参考訳(メタデータ) (2022-06-28T14:05:25Z) - Glue: Adaptively Merging Single Table Cardinality to Estimate Join Query
Size [35.1093718746362]
カーディナリティ推定(CardEst)は、高品質なクエリプランを生成する上で重要な役割を果たす。
CardEstの最も難しい問題、すなわち、複数のテーブル上でジョインクエリサイズを推定する方法は、広く解決されていない。
本稿では,テーブル単位のCardEst結果をサポートするGlueという,非常に一般的なフレームワークを提案する。
論文 参考訳(メタデータ) (2021-12-07T02:46:46Z) - Density Ratio Estimation via Infinitesimal Classification [85.08255198145304]
そこで我々は, DRE-inftyを提案する。 DRE-inftyは, 密度比推定(DRE)を, より簡単なサブプロブレムに還元する手法である。
モンテカルロ法にインスパイアされ、中間ブリッジ分布の無限連続体を介して2つの分布の間を滑らかに補間する。
提案手法は,複雑な高次元データセット上での相互情報推定やエネルギーベースモデリングなどの下流タスクにおいて良好に動作することを示す。
論文 参考訳(メタデータ) (2021-11-22T06:26:29Z) - Probabilistic Case-based Reasoning for Open-World Knowledge Graph
Completion [59.549664231655726]
ケースベース推論(CBR)システムは,与えられた問題に類似した事例を検索することで,新たな問題を解決する。
本稿では,知識ベース(KB)の推論において,そのようなシステムが実現可能であることを示す。
提案手法は,KB内の類似エンティティからの推論パスを収集することにより,エンティティの属性を予測する。
論文 参考訳(メタデータ) (2020-10-07T17:48:12Z) - NeuroCard: One Cardinality Estimator for All Tables [23.723132106252272]
NeuroCardは、データベース全体に1つの神経密度推定器を構築する結合濃度推定器である。
NeuroCardは、最も優れた先行手法よりも精度の高いオーダーを達成している。
論文 参考訳(メタデータ) (2020-06-15T03:21:46Z) - NN-based Transformation of Any SQL Cardinality Estimator for Handling
DISTINCT, AND, OR and NOT [1.8275108630751837]
クエリプランナーは、DISTINCTのクエリや計画において、セット理論の基数(すなわち重複のない)を必要とする。
多くの基数推定法は、重複数をカウントした共役クエリのみの基数の推定に限られる。
本論文では, 有限濃度推定モデルに適用可能な2つの手法について述べる。
論文 参考訳(メタデータ) (2020-04-15T11:20:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。