論文の概要: ZeroCard: Cardinality Estimation with Zero Dependence on Target Databases -- No Data, No Query, No Retraining
- arxiv url: http://arxiv.org/abs/2510.07983v1
- Date: Thu, 09 Oct 2025 09:16:01 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-10 17:54:14.981621
- Title: ZeroCard: Cardinality Estimation with Zero Dependence on Target Databases -- No Data, No Query, No Retraining
- Title(参考訳): ZeroCard: ターゲットデータベースへのゼロ依存による心拍数推定 -- データなし、クエリなし、リトレーニングなし
- Authors: Xianghong Xu, Rong Kang, Xiao He, Lei Zhang, Jianjun Chen, Tieying Zhang,
- Abstract要約: ZeroCardはセマンティクス駆動の濃度推定手法で、生のデータアクセスやクエリログ、ターゲットデータベースの再トレーニングに依存せずに適用できる。
我々は、実世界のテーブルから派生した大規模クエリデータセットを構築し、ZeroCardを事前訓練することで、スキーマのセマンティクスや述語表現から濃度を学習することができる。
事前トレーニング後、ZeroCardのパラメータは、既製の方法で凍結して適用することができる。
- 参考スコア(独自算出の注目度): 10.377902293565448
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Cardinality estimation is a fundamental task in database systems and plays a critical role in query optimization. Despite significant advances in learning-based cardinality estimation methods, most existing approaches remain difficult to generalize to new datasets due to their strong dependence on raw data or queries, thus limiting their practicality in real scenarios. To overcome these challenges, we argue that semantics in the schema may benefit cardinality estimation, and leveraging such semantics may alleviate these dependencies. To this end, we introduce ZeroCard, the first semantics-driven cardinality estimation method that can be applied without any dependence on raw data access, query logs, or retraining on the target database. Specifically, we propose to predict data distributions using schema semantics, thereby avoiding raw data dependence. Then, we introduce a query template-agnostic representation method to alleviate query dependence. Finally, we construct a large-scale query dataset derived from real-world tables and pretrain ZeroCard on it, enabling it to learn cardinality from schema semantics and predicate representations. After pretraining, ZeroCard's parameters can be frozen and applied in an off-the-shelf manner. We conduct extensive experiments to demonstrate the distinct advantages of ZeroCard and show its practical applications in query optimization. Its zero-dependence property significantly facilitates deployment in real-world scenarios.
- Abstract(参考訳): カーディナリティ推定はデータベースシステムの基本課題であり、クエリ最適化において重要な役割を果たす。
学習に基づく濃度推定法の大幅な進歩にもかかわらず、既存のほとんどのアプローチは、生のデータやクエリに強く依存しているため、新しいデータセットに一般化することは困難であり、実際のシナリオにおける実用性を制限する。
これらの課題を克服するために、スキーマのセマンティクスは基数推定の恩恵を受ける可能性があり、そのようなセマンティクスを活用することでこれらの依存関係を緩和できると論じる。
この目的のために、ZeroCardは、生データアクセス、クエリログ、ターゲットデータベースの再トレーニングに依存せずに適用可能な、セマンティクス駆動の初となる濃度推定手法である。
具体的には,スキーマセマンティクスを用いてデータ分布を予測し,生データ依存を回避することを提案する。
次に,クエリ依存を軽減するために,クエリテンプレートに依存しない表現手法を提案する。
最後に、実世界のテーブルから派生した大規模クエリデータセットを構築し、ZeroCardを事前訓練し、スキーマのセマンティクスや述語表現から濃度を学習する。
事前トレーニング後、ZeroCardのパラメータは、既製の方法で凍結して適用することができる。
我々は、ZeroCardの独特な利点を実証する広範囲な実験を行い、クエリ最適化におけるその実践的応用を示す。
そのゼロディペンデンス特性は、現実世界のシナリオへのデプロイを著しく促進する。
関連論文リスト
- Semantic Caching for Low-Cost LLM Serving: From Offline Learning to Online Adaptation [54.61034867177997]
キャッシング推論応答は、大きな言語モデルに他の前方を通さずに、それらを検索することができる。
従来の正確なキャッシュは、クエリ間のセマンティックな類似性を見落とし、不要な再計算をもたらす。
本稿では,未知のクエリおよびコスト分布下でのセマンティックキャッシュ消去のための,原則的,学習ベースのフレームワークを提案する。
論文 参考訳(メタデータ) (2025-08-11T06:53:27Z) - Maximally-Informative Retrieval for State Space Model Generation [59.954191072042526]
テスト時に特定のクエリに対するモデル不確実性を最小化するために、Retrieval In-Context Optimization (RICO)を導入する。
文書検索に外部に依存した従来の検索強化生成(RAG)とは異なり,本手法はモデルから直接のフィードバックを利用する。
モデル勾配を用いた標準のトップ$kの検索は、最適化手順を近似し、残余損失への接続を提供することを示す。
論文 参考訳(メタデータ) (2025-06-13T18:08:54Z) - ACE: A Cardinality Estimator for Set-Valued Queries [35.31790118566289]
本稿では,設定値データに対する問合せの濃度を推定するアテンションベースカルディナリティ・エストリメータを提案する。
可変サイズのクエリを処理するために、プールモジュールを導入し、次に回帰モデル(MLP)を使用して最終的な濃度推定を生成する。
論文 参考訳(メタデータ) (2025-03-19T06:29:15Z) - CardBench: A Benchmark for Learned Cardinality Estimation in Relational Databases [17.46316633654637]
データベースにおける高いクエリパフォーマンスを実現するには、心臓病推定が不可欠である。
研究者が新しい学習アプローチによる進捗を評価することができるような、体系的なベンチマークやデータセットは存在しない。
我々は,20の異なる実世界のデータベースに数千のクエリを格納したベンチマークを,学習された濃度推定のためにリリースした。
論文 参考訳(メタデータ) (2024-08-28T23:25:25Z) - A Fixed-Point Approach to Unified Prompt-Based Counting [51.20608895374113]
本研究の目的は,ボックス,ポイント,テキストなど,さまざまなプロンプト型で示されるオブジェクトの密度マップを生成することができる包括的プロンプトベースのカウントフレームワークを確立することである。
本モデルは,クラスに依存しない顕著なデータセットに優れ,データセット間の適応タスクにおいて優れた性能を示す。
論文 参考訳(メタデータ) (2024-03-15T12:05:44Z) - HyperImpute: Generalized Iterative Imputation with Automatic Model
Selection [77.86861638371926]
カラムワイズモデルを適応的かつ自動的に構成するための一般化反復計算フレームワークを提案する。
既製の学習者,シミュレータ,インターフェースを備えた具体的な実装を提供する。
論文 参考訳(メタデータ) (2022-06-15T19:10:35Z) - Cardinality Estimation in DBMS: A Comprehensive Benchmark Evaluation [43.27881697012329]
カーディナリティ推定(CardEst)は、クエリワークロードの高品質なクエリプランを生成する上で重要な役割を果たす。
本稿では,実際のデータセットにおけるCardEst手法の有効性を包括的かつ体系的に比較する。
我々はCardEstの新しいベンチマークを構築し、それは新しい複雑な現実世界STATSと多様なクエリSTATS-CEBを含んでいる。
論文 参考訳(メタデータ) (2021-09-13T11:25:02Z) - Probabilistic Case-based Reasoning for Open-World Knowledge Graph
Completion [59.549664231655726]
ケースベース推論(CBR)システムは,与えられた問題に類似した事例を検索することで,新たな問題を解決する。
本稿では,知識ベース(KB)の推論において,そのようなシステムが実現可能であることを示す。
提案手法は,KB内の類似エンティティからの推論パスを収集することにより,エンティティの属性を予測する。
論文 参考訳(メタデータ) (2020-10-07T17:48:12Z) - Learning to Count in the Crowd from Limited Labeled Data [109.2954525909007]
我々は,限られた数のラベル付きサンプルから参加者を数えることを学ぶことで,アノテーションの努力を減らすことに重点を置いている。
具体的には,未ラベルデータに対する擬似地下真理推定を含むガウス過程に基づく反復学習機構を提案する。
論文 参考訳(メタデータ) (2020-07-07T04:17:01Z) - NN-based Transformation of Any SQL Cardinality Estimator for Handling
DISTINCT, AND, OR and NOT [1.8275108630751837]
クエリプランナーは、DISTINCTのクエリや計画において、セット理論の基数(すなわち重複のない)を必要とする。
多くの基数推定法は、重複数をカウントした共役クエリのみの基数の推定に限られる。
本論文では, 有限濃度推定モデルに適用可能な2つの手法について述べる。
論文 参考訳(メタデータ) (2020-04-15T11:20:06Z) - Monotonic Cardinality Estimation of Similarity Selection: A Deep
Learning Approach [22.958342743597044]
類似度選択の基数推定にディープラーニングを活用する可能性について検討する。
本稿では,任意のデータ型や距離関数に適用可能な,新規で汎用的な手法を提案する。
論文 参考訳(メタデータ) (2020-02-15T20:22:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。