論文の概要: A Survey on Advancing the DBMS Query Optimizer: Cardinality Estimation,
Cost Model, and Plan Enumeration
- arxiv url: http://arxiv.org/abs/2101.01507v1
- Date: Tue, 5 Jan 2021 13:47:45 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-11 11:31:59.124716
- Title: A Survey on Advancing the DBMS Query Optimizer: Cardinality Estimation,
Cost Model, and Plan Enumeration
- Title(参考訳): DBMSクエリオプティマイザの強化に関する調査研究:心拍数推定,コストモデル,計画列挙
- Authors: Hai Lan, Zhifeng Bao, Yuwei Peng
- Abstract要約: コストベースのアルゴリズムは、現在のほとんどのデータベースシステムで採用されている。
コストモデル、カーディナリティでは、オペレータによる数字の数は重要な役割を果たします。
基数推定の不正確さ、コストの誤差、および巨大な計画空間モデルにより、アルゴリズムは複雑なクエリに対して妥当な時間で最適な実行計画を見つけることができない。
- 参考スコア(独自算出の注目度): 17.75042918159419
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Query optimizer is at the heart of the database systems. Cost-based optimizer
studied in this paper is adopted in almost all current database systems. A
cost-based optimizer introduces a plan enumeration algorithm to find a
(sub)plan, and then uses a cost model to obtain the cost of that plan, and
selects the plan with the lowest cost. In the cost model, cardinality, the
number of tuples through an operator, plays a crucial role. Due to the
inaccuracy in cardinality estimation, errors in cost model, and the huge plan
space, the optimizer cannot find the optimal execution plan for a complex query
in a reasonable time. In this paper, we first deeply study the causes behind
the limitations above. Next, we review the techniques used to improve the
quality of the three key components in the cost-based optimizer, cardinality
estimation, cost model, and plan enumeration. We also provide our insights on
the future directions for each of the above aspects.
- Abstract(参考訳): クエリオプティマイザはデータベースシステムの中心にあります。
本稿では, ほぼすべてのデータベースシステムにおいて, コストベースオプティマイザが採用されている。
コストベースのオプティマイザは、(サブ)プランを見つけるためにプラン列挙アルゴリズムを導入し、そのプランのコストを取得するためにコストモデルを使用し、最小コストでプランを選択する。
コストモデルでは、演算子によるタプルの数である濃度が重要な役割を果たす。
基数推定の不正確さ、コストモデルにおける誤差、および巨大な計画空間のため、最適化器は複雑なクエリに対する最適な実行計画を見出すことができない。
本稿では,まず,上記の制限の背景にある原因について深く研究する。
次に,コストベースのオプティマイザ,濃度推定,コストモデル,計画列挙における3つの重要なコンポーネントの品質向上手法について検討する。
また、上記各側面の今後の方向性についての洞察も提供します。
関連論文リスト
- Reinforcement Learning from Human Feedback with Active Queries [67.27150911254155]
現在の強化学習アプローチは、多くの場合、大量の人間による嗜好データを必要とする。
本稿では,能動学習の成功に触発されたクエリ効率の高いRLHF手法を提案する。
実験の結果,ADPOは人間の好みに対するクエリの約半分しか作成していないが,最先端のDPO法の性能と一致していることがわかった。
論文 参考訳(メタデータ) (2024-02-14T18:58:40Z) - Roq: Robust Query Optimization Based on a Risk-aware Learned Cost Model [3.0784574277021406]
本稿では,リスク認識型学習アプローチに基づくロバストなクエリ最適化を実現するための包括的フレームワークを提案する。
Roqには、クエリ最適化の文脈におけるロバストネスの概念の新たな形式化が含まれている。
我々は、Roqが最先端技術と比較して堅牢なクエリ最適化に大幅な改善をもたらすことを実験的に実証した。
論文 参考訳(メタデータ) (2024-01-26T21:16:37Z) - Rethinking and Benchmarking Predict-then-Optimize Paradigm for
Combinatorial Optimization Problems [62.25108152764568]
多くのWebアプリケーションは、エネルギーコストを考慮したスケジューリング、Web広告の予算配分、ソーシャルネットワークでのグラフマッチングなど、最適化問題の解決に頼っている。
統一システムにおける予測と意思決定の性能について考察する。
我々は、現在のアプローチを包括的に分類し、既存の実験シナリオを統合する。
論文 参考訳(メタデータ) (2023-11-13T13:19:34Z) - JoinGym: An Efficient Query Optimization Environment for Reinforcement
Learning [58.71541261221863]
結合順序選択(JOS)は、クエリの実行コストを最小化するために結合操作を順序付けする問題である。
木質強化学習(RL)のためのクエリ最適化環境JoinGymを提案する。
JoinGymは内部で、事前計算されたデータセットから中間結果の濃度を調べることで、クエリプランのコストをシミュレートする。
論文 参考訳(メタデータ) (2023-07-21T17:00:06Z) - Bayesian Optimization Over Iterative Learners with Structured Responses:
A Budget-aware Planning Approach [31.918476422203412]
本稿では,HPO 問題を解決するため,Budget-Aware Planning for Iterative Learningers (BAPI) と呼ばれる新しい手法を提案する。
反復学習者のための多様なHPOベンチマークの実験では、ほとんどの場合、BAPIは最先端のベースラインよりも優れた性能を示している。
論文 参考訳(メタデータ) (2022-06-25T18:44:06Z) - Planning with Dynamically Estimated Action Costs [2.8326418377665346]
実際のAI計画アプリケーションには、アクションコストに関する情報が不可欠だ。
近年のアプローチでは、データからしばしば学習されるブラックボックス外部アクションコスト推定器が計画段階で適用されている。
本稿では,行動コストを考慮した決定論的計画の一般化を提案する。
論文 参考訳(メタデータ) (2022-06-08T21:10:37Z) - Cost Optimal Planning as Satisfiability [5.482532589225552]
コストを考慮したsatベースの計画符号化の地平線として,コスト最適計画の長さの上限を用いる。
このSATベースのアプローチにより、より優れたコストでプランを計算できることを実験的に示し、多くの場合、最適なコストに適合できることを示した。
論文 参考訳(メタデータ) (2021-03-03T12:18:18Z) - Offline Model-Based Optimization via Normalized Maximum Likelihood
Estimation [101.22379613810881]
データ駆動最適化の問題を検討し、一定の点セットでクエリのみを与えられた関数を最大化する必要がある。
この問題は、関数評価が複雑で高価なプロセスである多くの領域に現れる。
我々は,提案手法を高容量ニューラルネットワークモデルに拡張可能なトラクタブル近似を提案する。
論文 参考訳(メタデータ) (2021-02-16T06:04:27Z) - On Exploiting Hitting Sets for Model Reconciliation [53.81101846598925]
ヒューマン・アウェア・プランニングにおいて、プランニング・エージェントは、その計画がなぜ最適なのかを人間に説明する必要があるかもしれない。
この手法はモデル和解と呼ばれ、エージェントはモデルと人間のモデルの違いを調和させようとする。
我々は,計画の領域を超えて拡張されたモデル和解のための論理ベースのフレームワークを提案する。
論文 参考訳(メタデータ) (2020-12-16T21:25:53Z) - Optimal Bayesian experimental design for subsurface flow problems [77.34726150561087]
本稿では,設計ユーティリティ機能のためのカオス拡張サロゲートモデル(PCE)の開発のための新しいアプローチを提案する。
この手法により,対象関数に対する適切な品質応答面の導出が可能となり,計算予算は複数の単点評価に匹敵する。
論文 参考訳(メタデータ) (2020-08-10T09:42:59Z) - Tiering as a Stochastic Submodular Optimization Problem [5.659969270836789]
タイアリングは大規模情報検索システムを構築する上で欠かせない技術である。
最適化問題としての最適階層化は、部分モジュラーなknapsack制約を伴う部分モジュラー最小化問題として適用可能であることを示す。
論文 参考訳(メタデータ) (2020-05-16T07:39:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。