論文の概要: ACE: A Cardinality Estimator for Set-Valued Queries
- arxiv url: http://arxiv.org/abs/2503.14929v1
- Date: Wed, 19 Mar 2025 06:29:15 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-20 15:21:58.217891
- Title: ACE: A Cardinality Estimator for Set-Valued Queries
- Title(参考訳): ACE: セットバリュークエリのためのカーディナリティ推定器
- Authors: Yufan Sheng, Xin Cao, Kaiqi Zhao, Yixiang Fang, Jianzhong Qi, Wenjie Zhang, Christian S. Jensen,
- Abstract要約: 本稿では,設定値データに対する問合せの濃度を推定するアテンションベースカルディナリティ・エストリメータを提案する。
可変サイズのクエリを処理するために、プールモジュールを導入し、次に回帰モデル(MLP)を使用して最終的な濃度推定を生成する。
- 参考スコア(独自算出の注目度): 35.31790118566289
- License:
- Abstract: Cardinality estimation is a fundamental functionality in database systems. Most existing cardinality estimators focus on handling predicates over numeric or categorical data. They have largely omitted an important data type, set-valued data, which frequently occur in contemporary applications such as information retrieval and recommender systems. The few existing estimators for such data either favor high-frequency elements or rely on a partial independence assumption, which limits their practical applicability. We propose ACE, an Attention-based Cardinality Estimator for estimating the cardinality of queries over set-valued data. We first design a distillation-based data encoder to condense the dataset into a compact matrix. We then design an attention-based query analyzer to capture correlations among query elements. To handle variable-sized queries, a pooling module is introduced, followed by a regression model (MLP) to generate final cardinality estimates. We evaluate ACE on three datasets with varying query element distributions, demonstrating that ACE outperforms the state-of-the-art competitors in terms of both accuracy and efficiency.
- Abstract(参考訳): カーディナリティ推定はデータベースシステムの基本機能である。
既存の濃度推定器の多くは、数値データや分類データよりも述語を扱うことに重点を置いている。
それらは、情報検索やレコメンデーションシステムといった現代のアプリケーションで頻繁に発生する重要なデータ型、集合値データの大部分を省略している。
このようなデータに対する数少ない既存の推定者は、高周波要素を好むか、あるいは部分的な独立性の仮定に依存している。
本稿では,集合値データに対するクエリの濃度を推定するための,注意力に基づく心性推定器であるACEを提案する。
まず, 蒸留データエンコーダを設計し, データセットをコンパクトな行列に凝縮する。
次に、クエリー要素間の相関を捉えるために、注意に基づくクエリーアナライザを設計する。
可変サイズのクエリを処理するために、プールモジュールを導入し、次に回帰モデル(MLP)を使用して最終的な濃度推定を生成する。
クエリ要素の分布が異なる3つのデータセット上でACEを評価し、ACEは精度と効率の両面で最先端の競合より優れていることを示した。
関連論文リスト
- CardBench: A Benchmark for Learned Cardinality Estimation in Relational Databases [17.46316633654637]
データベースにおける高いクエリパフォーマンスを実現するには、心臓病推定が不可欠である。
研究者が新しい学習アプローチによる進捗を評価することができるような、体系的なベンチマークやデータセットは存在しない。
我々は,20の異なる実世界のデータベースに数千のクエリを格納したベンチマークを,学習された濃度推定のためにリリースした。
論文 参考訳(メタデータ) (2024-08-28T23:25:25Z) - Adaptive Retrieval and Scalable Indexing for k-NN Search with Cross-Encoders [77.84801537608651]
クエリ-イムペアを共同で符号化することで類似性を計算するクロスエンコーダ(CE)モデルは、クエリ-イム関連性を推定する埋め込みベースモデル(デュアルエンコーダ)よりも優れている。
本稿では,潜時クエリとアイテム埋め込みを効率的に計算してCEスコアを近似し,CE類似度を近似したk-NN探索を行うスパース行列分解法を提案する。
論文 参考訳(メタデータ) (2024-05-06T17:14:34Z) - Minimally Supervised Learning using Topological Projections in
Self-Organizing Maps [55.31182147885694]
自己組織化マップ(SOM)におけるトポロジカルプロジェクションに基づく半教師付き学習手法を提案する。
提案手法は,まずラベル付きデータ上でSOMを訓練し,最小限のラベル付きデータポイントをキーベストマッチングユニット(BMU)に割り当てる。
提案した最小教師付きモデルが従来の回帰手法を大幅に上回ることを示す。
論文 参考訳(メタデータ) (2024-01-12T22:51:48Z) - Improving Text Matching in E-Commerce Search with A Rationalizable,
Intervenable and Fast Entity-Based Relevance Model [78.80174696043021]
エンティティベース関連モデル(EBRM)と呼ばれる新しいモデルを提案する。
この分解により、高精度にクロスエンコーダQE関連モジュールを使用できる。
また、ユーザログから自動生成されたQEデータによるQEモジュールの事前トレーニングにより、全体的なパフォーマンスが向上することを示す。
論文 参考訳(メタデータ) (2023-07-01T15:44:53Z) - Scardina: Scalable Join Cardinality Estimation by Multiple Density
Estimators [8.641606056228675]
機械学習に基づく濃度推定手法が従来の手法に取って代わっている。
スキーマ構造に基づく分割モデルを用いた新しい結合濃度推定法であるScardinaを提案する。
論文 参考訳(メタデータ) (2023-03-31T13:22:28Z) - Electra: Conditional Generative Model based Predicate-Aware Query
Approximation [10.056919500568013]
ELECTRAは述語対応のAQPシステムで、多くの述語で分析スタイルのクエリに答えることができ、近似誤差ははるかに小さい。
実世界の3つのデータセットに対する4つの異なるベースラインによる評価の結果,ELECTRAはベースラインと比較して多数の述語に対して低いAQP誤差を提供することがわかった。
論文 参考訳(メタデータ) (2022-01-28T21:13:26Z) - Improving Attention Mechanism with Query-Value Interaction [92.67156911466397]
本稿では,問合せ対応の注目値を学習可能な問合せ-値相互作用関数を提案する。
我々のアプローチは、多くの注意に基づくモデルの性能を一貫して改善することができる。
論文 参考訳(メタデータ) (2020-10-08T05:12:52Z) - Novel Human-Object Interaction Detection via Adversarial Domain
Generalization [103.55143362926388]
本研究では,新たな人-物間相互作用(HOI)検出の問題点を考察し,モデルの一般化能力を向上させることを目的とした。
この課題は、主に対象と述語の大きな構成空間に起因し、全ての対象と述語の組み合わせに対する十分な訓練データが欠如している。
本稿では,予測のためのオブジェクト指向不変の特徴を学習するために,対数領域の一般化の統一的な枠組みを提案する。
論文 参考訳(メタデータ) (2020-05-22T22:02:56Z) - NN-based Transformation of Any SQL Cardinality Estimator for Handling
DISTINCT, AND, OR and NOT [1.8275108630751837]
クエリプランナーは、DISTINCTのクエリや計画において、セット理論の基数(すなわち重複のない)を必要とする。
多くの基数推定法は、重複数をカウントした共役クエリのみの基数の推定に限られる。
本論文では, 有限濃度推定モデルに適用可能な2つの手法について述べる。
論文 参考訳(メタデータ) (2020-04-15T11:20:06Z) - Monotonic Cardinality Estimation of Similarity Selection: A Deep
Learning Approach [22.958342743597044]
類似度選択の基数推定にディープラーニングを活用する可能性について検討する。
本稿では,任意のデータ型や距離関数に適用可能な,新規で汎用的な手法を提案する。
論文 参考訳(メタデータ) (2020-02-15T20:22:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。