論文の概要: CoLSE: A Lightweight and Robust Hybrid Learned Model for Single-Table Cardinality Estimation using Joint CDF
- arxiv url: http://arxiv.org/abs/2512.12624v1
- Date: Sun, 14 Dec 2025 10:08:20 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-16 17:54:56.351929
- Title: CoLSE: A Lightweight and Robust Hybrid Learned Model for Single-Table Cardinality Estimation using Joint CDF
- Title(参考訳): CoLSE:ジョイントCDFを用いたシングルテーブル心機能評価のための軽量・ロバストハイブリッド学習モデル
- Authors: Lankadinee Rathuwadu, Guanli Liu, Christopher Leckie, Renata Borovica-Gajic,
- Abstract要約: カーディナリティ推定は、クエリ最適化の重要なコンポーネントである。
単点濃度推定のためのハイブリッド学習手法であるCoLSEを提案する。
実験の結果,CoLSEは精度,トレーニング時間,レイテンシ,モデルサイズにおいて良好なトレードオフを実現し,既存の最先端手法よりも優れていた。
- 参考スコア(独自算出の注目度): 7.945011337356916
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Cardinality estimation (CE), the task of predicting the result size of queries is a critical component of query optimization. Accurate estimates are essential for generating efficient query execution plans. Recently, machine learning techniques have been applied to CE, broadly categorized into query-driven and data-driven approaches. Data-driven methods learn the joint distribution of data, while query-driven methods construct regression models that map query features to cardinalities. Ideally, a CE technique should strike a balance among three key factors: accuracy, efficiency, and memory footprint. However, existing state-of-the-art models often fail to achieve this balance. To address this, we propose CoLSE, a hybrid learned approach for single-table cardinality estimation. CoLSE directly models the joint probability over queried intervals using a novel algorithm based on copula theory and integrates a lightweight neural network to correct residual estimation errors. Experimental results show that CoLSE achieves a favorable trade-off among accuracy, training time, inference latency, and model size, outperforming existing state-of-the-art methods.
- Abstract(参考訳): クエリの結果サイズを予測するタスクであるCardinality Estimation (CE)は、クエリ最適化の重要なコンポーネントである。
効率的なクエリ実行計画を生成するには、正確な見積が不可欠だ。
近年、機械学習技術がCEに適用され、クエリ駆動とデータ駆動のアプローチに広く分類されている。
データ駆動手法はデータの連成分布を学習し、クエリ駆動手法は、クエリ特徴を濃度にマッピングする回帰モデルを構築する。
理想的には、CEテクニックは、正確性、効率性、メモリフットプリントという3つの重要な要素のバランスをとるべきである。
しかし、既存の最先端モデルは、しばしばこのバランスを達成できない。
これを解決するために,単一テーブル濃度推定のためのハイブリッド学習手法であるCoLSEを提案する。
CoLSEは、コプラ理論に基づく新しいアルゴリズムを用いて、クエリ間隔で結合確率を直接モデル化し、残差推定誤差を補正するために軽量ニューラルネットワークを統合する。
実験の結果,CoLSEは精度,トレーニング時間,推論遅延,モデルサイズにおいて良好なトレードオフを実現し,既存の最先端手法よりも優れていた。
関連論文リスト
- A Lightweight Learned Cardinality Estimation Model [12.33987311866824]
本稿では,Covering with Decompositions (Covering with Decompositions) と呼ばれる新しいデータ駆動手法を提案する。
CoDeでは、表を複数の小さな重なり合うセグメントに分割するカバーデザインという概念を採用している。
複数のモデルを用いて分布を近似することで、CoDeは離散分布を効果的にモデル化し、計算効率を確保する。
論文 参考訳(メタデータ) (2025-08-13T08:34:58Z) - Self-Boost via Optimal Retraining: An Analysis via Approximate Message Passing [58.52119063742121]
独自の予測と潜在的にノイズの多いラベルを使ってモデルをトレーニングすることは、モデルパフォーマンスを改善するためのよく知られた戦略である。
本稿では,モデルの予測と提供ラベルを最適に組み合わせる方法について論じる。
我々の主な貢献は、現在のモデルの予測と与えられたラベルを組み合わせたベイズ最適集約関数の導出である。
論文 参考訳(メタデータ) (2025-05-21T07:16:44Z) - DistJoin: A Decoupled Join Cardinality Estimator based on Adaptive Neural Predicate Modulation [11.506172695239576]
多自己回帰モデルを用いた効率的な分布予測に基づく結合濃度推定器DistJoinを紹介する。
DistJoinは、データ更新に対する高い正確性、堅牢性、汎用性、および既存のメソッドに対する同等の更新と推論速度を緩和することを示した。
論文 参考訳(メタデータ) (2025-03-12T02:07:08Z) - Ranking and Combining Latent Structured Predictive Scores without Labeled Data [2.5064967708371553]
本稿では,新しい教師なしアンサンブル学習モデル(SUEL)を提案する。
連続的な予測スコアを持つ予測器のセット間の依存関係を利用して、ラベル付きデータなしで予測器をランク付けし、それらをアンサンブルされたスコアに重み付けする。
提案手法の有効性は、シミュレーション研究とリスク遺伝子発見の現実的応用の両方を通じて厳密に評価されている。
論文 参考訳(メタデータ) (2024-08-14T20:14:42Z) - Adaptive Retrieval and Scalable Indexing for k-NN Search with Cross-Encoders [77.84801537608651]
クエリ-イムペアを共同で符号化することで類似性を計算するクロスエンコーダ(CE)モデルは、クエリ-イム関連性を推定する埋め込みベースモデル(デュアルエンコーダ)よりも優れている。
本稿では,潜時クエリとアイテム埋め込みを効率的に計算してCEスコアを近似し,CE類似度を近似したk-NN探索を行うスパース行列分解法を提案する。
論文 参考訳(メタデータ) (2024-05-06T17:14:34Z) - HyperImpute: Generalized Iterative Imputation with Automatic Model
Selection [77.86861638371926]
カラムワイズモデルを適応的かつ自動的に構成するための一般化反復計算フレームワークを提案する。
既製の学習者,シミュレータ,インターフェースを備えた具体的な実装を提供する。
論文 参考訳(メタデータ) (2022-06-15T19:10:35Z) - Probabilistic Case-based Reasoning for Open-World Knowledge Graph
Completion [59.549664231655726]
ケースベース推論(CBR)システムは,与えられた問題に類似した事例を検索することで,新たな問題を解決する。
本稿では,知識ベース(KB)の推論において,そのようなシステムが実現可能であることを示す。
提案手法は,KB内の類似エンティティからの推論パスを収集することにより,エンティティの属性を予測する。
論文 参考訳(メタデータ) (2020-10-07T17:48:12Z) - Control as Hybrid Inference [62.997667081978825]
本稿では、反復推論と償却推論のバランスを自然に仲介するCHIの実装について述べる。
連続的な制御ベンチマークでアルゴリズムのスケーラビリティを検証し、強力なモデルフリーおよびモデルベースラインを上回る性能を示す。
論文 参考訳(メタデータ) (2020-07-11T19:44:09Z) - Meta-Learned Confidence for Few-shot Learning [60.6086305523402]
数ショットのメトリックベースのアプローチのための一般的なトランスダクティブ推論手法は、最も確実なクエリ例の平均で、各クラスのプロトタイプを更新することである。
本稿では,各クエリの信頼度をメタラーニングして,ラベルのないクエリに最適な重みを割り当てる手法を提案する。
4つのベンチマークデータセットに対してメタ学習の信頼度で、少数ショットの学習モデルを検証した。
論文 参考訳(メタデータ) (2020-02-27T10:22:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。