論文の概要: NeuroCard: One Cardinality Estimator for All Tables
- arxiv url: http://arxiv.org/abs/2006.08109v2
- Date: Mon, 2 Nov 2020 19:15:11 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-21 05:01:15.282840
- Title: NeuroCard: One Cardinality Estimator for All Tables
- Title(参考訳): NeuroCard: すべてのテーブルに対する1つの心電図推定器
- Authors: Zongheng Yang, Amog Kamsetty, Sifei Luan, Eric Liang, Yan Duan, Xi
Chen, and Ion Stoica
- Abstract要約: NeuroCardは、データベース全体に1つの神経密度推定器を構築する結合濃度推定器である。
NeuroCardは、最も優れた先行手法よりも精度の高いオーダーを達成している。
- 参考スコア(独自算出の注目度): 23.723132106252272
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Query optimizers rely on accurate cardinality estimates to produce good
execution plans. Despite decades of research, existing cardinality estimators
are inaccurate for complex queries, due to making lossy modeling assumptions
and not capturing inter-table correlations. In this work, we show that it is
possible to learn the correlations across all tables in a database without any
independence assumptions. We present NeuroCard, a join cardinality estimator
that builds a single neural density estimator over an entire database.
Leveraging join sampling and modern deep autoregressive models, NeuroCard makes
no inter-table or inter-column independence assumptions in its probabilistic
modeling. NeuroCard achieves orders of magnitude higher accuracy than the best
prior methods (a new state-of-the-art result of 8.5$\times$ maximum error on
JOB-light), scales to dozens of tables, while being compact in space (several
MBs) and efficient to construct or update (seconds to minutes).
- Abstract(参考訳): クエリオプティマイザは、適切な実行計画を生成するために正確な濃度推定に依存する。
何十年にもわたっての研究にもかかわらず、既存の濃度推定器は複雑なクエリには不正確である。
本研究では,データベース内のすべてのテーブルにまたがる相関関係を独立性の仮定なしで学習可能であることを示す。
データベース全体にわたって単一の神経密度推定器を構築する結合濃度推定器neurocardを提案する。
結合サンプリングと現代の深層自己回帰モデルを活用して、NeuroCardは確率的モデリングにおいて、テーブル間またはカラム間独立の仮定をしない。
NeuroCardは従来の方法よりも桁違いに精度が高く(JOB-lightでは8.5$\times$ max error)、数十のテーブルにスケールするが、空間(複数のMB)はコンパクトで、構成や更新(秒から数分)が効率的である。
関連論文リスト
- CardBench: A Benchmark for Learned Cardinality Estimation in Relational Databases [17.46316633654637]
データベースにおける高いクエリパフォーマンスを実現するには、心臓病推定が不可欠である。
研究者が新しい学習アプローチによる進捗を評価することができるような、体系的なベンチマークやデータセットは存在しない。
我々は,20の異なる実世界のデータベースに数千のクエリを格納したベンチマークを,学習された濃度推定のためにリリースした。
論文 参考訳(メタデータ) (2024-08-28T23:25:25Z) - PRICE: A Pretrained Model for Cross-Database Cardinality Estimation [78.30959470441442]
クエリ実行計画の最適化には,カーディナリティ推定(CardEst)が不可欠である。
近年のMLベースのCardEst法は, 製造コストが高いため, 高い精度で展開が困難である。
PRetrained MultI-table CardEstモデルであるPRICEを提案する。
論文 参考訳(メタデータ) (2024-06-03T06:21:53Z) - Scardina: Scalable Join Cardinality Estimation by Multiple Density
Estimators [8.641606056228675]
機械学習に基づく濃度推定手法が従来の手法に取って代わっている。
スキーマ構造に基づく分割モデルを用いた新しい結合濃度推定法であるScardinaを提案する。
論文 参考訳(メタデータ) (2023-03-31T13:22:28Z) - FactorJoin: A New Cardinality Estimation Framework for Join Queries [35.22928513918166]
カーディナリティ推定は、クエリ最適化における最も根本的で難しい問題の1つである。
結合クエリを推定する新しいフレームワークであるFacterJoinを提案する。
評価において、FacterJoinは従来の最先端の学習手法よりも効果的に推定できる。
論文 参考訳(メタデータ) (2022-12-11T15:51:39Z) - HyperImpute: Generalized Iterative Imputation with Automatic Model
Selection [77.86861638371926]
カラムワイズモデルを適応的かつ自動的に構成するための一般化反復計算フレームワークを提案する。
既製の学習者,シミュレータ,インターフェースを備えた具体的な実装を提供する。
論文 参考訳(メタデータ) (2022-06-15T19:10:35Z) - Glue: Adaptively Merging Single Table Cardinality to Estimate Join Query
Size [35.1093718746362]
カーディナリティ推定(CardEst)は、高品質なクエリプランを生成する上で重要な役割を果たす。
CardEstの最も難しい問題、すなわち、複数のテーブル上でジョインクエリサイズを推定する方法は、広く解決されていない。
本稿では,テーブル単位のCardEst結果をサポートするGlueという,非常に一般的なフレームワークを提案する。
論文 参考訳(メタデータ) (2021-12-07T02:46:46Z) - FLAT: Fast, Lightweight and Accurate Method for Cardinality Estimation [45.98791307420517]
確率計算の高速化とグラフィカルモデルサイズの軽量化,推定精度の向上を実現したCardEst法であるFLATを提案する。
FLATは、基礎となるFSPNモデル上で、ほぼ線形時間で効率的なオンライン確率計算をサポートする。
単一のテーブルクエリとマルチテーブルジョインクエリの両方の濃度を推定できる。
1〜5桁の精度、1〜3桁の確率速度、1~2桁のストレージコストを実現する。
論文 参考訳(メタデータ) (2020-11-18T01:14:45Z) - Probabilistic Case-based Reasoning for Open-World Knowledge Graph
Completion [59.549664231655726]
ケースベース推論(CBR)システムは,与えられた問題に類似した事例を検索することで,新たな問題を解決する。
本稿では,知識ベース(KB)の推論において,そのようなシステムが実現可能であることを示す。
提案手法は,KB内の類似エンティティからの推論パスを収集することにより,エンティティの属性を予測する。
論文 参考訳(メタデータ) (2020-10-07T17:48:12Z) - Nonparametric Estimation in the Dynamic Bradley-Terry Model [69.70604365861121]
カーネルのスムース化に依存する新しい推定器を開発し、時間とともにペア比較を前処理する。
モデルに依存しない設定における推定誤差と余剰リスクの両方について時間変化のオラクル境界を導出する。
論文 参考訳(メタデータ) (2020-02-28T21:52:49Z) - Meta-Learned Confidence for Few-shot Learning [60.6086305523402]
数ショットのメトリックベースのアプローチのための一般的なトランスダクティブ推論手法は、最も確実なクエリ例の平均で、各クラスのプロトタイプを更新することである。
本稿では,各クエリの信頼度をメタラーニングして,ラベルのないクエリに最適な重みを割り当てる手法を提案する。
4つのベンチマークデータセットに対してメタ学習の信頼度で、少数ショットの学習モデルを検証した。
論文 参考訳(メタデータ) (2020-02-27T10:22:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。