論文の概要: CardOOD: Robust Query-driven Cardinality Estimation under Out-of-Distribution
- arxiv url: http://arxiv.org/abs/2412.05864v1
- Date: Sun, 08 Dec 2024 09:11:11 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-12-10 14:53:39.562554
- Title: CardOOD: Robust Query-driven Cardinality Estimation under Out-of-Distribution
- Title(参考訳): CardOOD: アウト・オブ・ディストリビューションによるロバストクエリ駆動型心拍推定
- Authors: Rui Li, Kangfei Zhao, Jeffrey Xu Yu, Guoren Wang,
- Abstract要約: CardOODは、堅牢なクエリ駆動の濃度推定器を構築するために設計された一般的な学習フレームワークである。
古典的移動/ロマンス学習手法を拡張して,クエリ駆動の濃度推定器を訓練する。
また,濃度推定の特性を利用した新しい学習アルゴリズムを提案する。
- 参考スコア(独自算出の注目度): 36.98419661266168
- License:
- Abstract: Query-driven learned estimators are accurate, flexible, and lightweight alternatives to traditional estimators in query optimization. However, existing query-driven approaches struggle with the Out-of-distribution (OOD) problem, where the test workload distribution differs from the training workload, leading to performancedegradation. In this paper, we present CardOOD, a general learning framework designed to construct robust query-driven cardinality estimators that are resilient against the OOD problem. Our framework focuses on offline training algorithms that develop one-off models from a static workload, suitable for model initialization and periodic retraining. In CardOOD, we extend classical transfer/robust learning techniques to train query-driven cardinalityestimators, and the algorithms fall into three categories: representation learning, data manipulation, and new learning strategies. As these learning techniques are originally evaluated in computervision tasks, we also propose a new learning algorithm that exploits the property of cardinality estimation. This algorithm, lying in the category of new learning strategy, models the partial order constraint of cardinalities by a self-supervised learning task. Comprehensive experimental studies demonstrate the efficacy of the algorithms of CardOOD in mitigating the OOD problem to varying extents. We further integrate CardOOD into PostgreSQL, showcasing its practical utility in query optimization.
- Abstract(参考訳): クエリ駆動学習推定器は、クエリ最適化における従来の推定器の精度、柔軟性、軽量な代替手段である。
しかし、既存のクエリ駆動アプローチは、テストワークロードの分布がトレーニングワークロードと異なるOOD(Out-of-distriion)問題に苦しむため、パフォーマンスが低下する。
本稿では,OOD問題に対して耐性のある堅牢なクエリ駆動型濃度推定器を構築するための一般学習フレームワークであるCardOODを提案する。
本フレームワークは、静的なワークロードからワンオフモデルを開発するオフライントレーニングアルゴリズムに焦点を当て、モデルの初期化と定期的な再トレーニングに適したものである。
CardOODでは、古典的な転送/ロバスト学習手法を拡張して、クエリ駆動の濃度推定器を訓練し、アルゴリズムは表現学習、データ操作、新しい学習戦略の3つのカテゴリに分類される。
これらの学習手法はもともとコンピュータビジョンのタスクで評価されるため、濃度推定の特性を利用した新しい学習アルゴリズムも提案する。
このアルゴリズムは、新しい学習戦略のカテゴリに属するもので、自己教師型学習タスクによって、濃度の部分順序制約をモデル化する。
総合的な実験的研究は、OOD問題を様々な範囲で緩和する上で、CardOODのアルゴリズムの有効性を実証している。
CardOODをPostgreSQLに統合し、クエリ最適化の実用性を示します。
関連論文リスト
- Learning Decision Trees and Forests with Algorithmic Recourse [11.401006371457436]
Algorithmic Recourse(AR)は、モデルによって与えられる望ましくない予測結果を変更するためのリコースアクションを提供することを目的としている。
我々は、できるだけ多くの事例に対して合理的な行動の存在を保証するという制約の下で、正確な分類木を学習するタスクを定式化する。
論文 参考訳(メタデータ) (2024-06-03T08:33:42Z) - PILOT: A Pre-Trained Model-Based Continual Learning Toolbox [71.63186089279218]
本稿では,PILOTとして知られるモデルベース連続学習ツールボックスについて紹介する。
一方、PILOTはL2P、DualPrompt、CODA-Promptといった事前学習モデルに基づいて、最先端のクラスインクリメンタル学習アルゴリズムを実装している。
一方、PILOTは、事前学習されたモデルの文脈に典型的なクラス増分学習アルゴリズムを適合させ、それらの効果を評価する。
論文 参考訳(メタデータ) (2023-09-13T17:55:11Z) - The Cascaded Forward Algorithm for Neural Network Training [61.06444586991505]
本稿では,ニューラルネットワークのための新しい学習フレームワークであるCascaded Forward(CaFo)アルゴリズムを提案する。
FFとは異なり、我々のフレームワークは各カスケードブロックのラベル分布を直接出力する。
我々のフレームワークでは、各ブロックは独立して訓練できるので、並列加速度システムに容易に展開できる。
論文 参考訳(メタデータ) (2023-03-17T02:01:11Z) - Improved Algorithms for Neural Active Learning [74.89097665112621]
非パラメトリックストリーミング設定のためのニューラルネットワーク(NN)ベースの能動学習アルゴリズムの理論的および経験的性能を改善する。
本研究では,SOTA(State-of-the-art (State-the-art)) 関連研究で使用されるものよりも,アクティブラーニングに適する人口減少を最小化することにより,2つの後悔の指標を導入する。
論文 参考訳(メタデータ) (2022-10-02T05:03:38Z) - DLCFT: Deep Linear Continual Fine-Tuning for General Incremental
Learning [29.80680408934347]
事前学習した表現からモデルを連続的に微調整するインクリメンタルラーニングのための代替フレームワークを提案する。
本手法は, ニューラルネットワークの線形化手法を利用して, 単純かつ効果的な連続学習を行う。
本手法は,データ増分,タスク増分およびクラス増分学習問題において,一般的な連続学習設定に適用可能であることを示す。
論文 参考訳(メタデータ) (2022-08-17T06:58:14Z) - Towards Diverse Evaluation of Class Incremental Learning: A Representation Learning Perspective [67.45111837188685]
クラスインクリメンタル学習(CIL)アルゴリズムは、インクリメンタルに到着したデータから新しいオブジェクトクラスを継続的に学習することを目的としている。
表現学習における様々な評価プロトコルを用いて,CILアルゴリズムによって訓練されたニューラルネットワークモデルを実験的に解析する。
論文 参考訳(メタデータ) (2022-06-16T11:44:11Z) - An Improved Reinforcement Learning Algorithm for Learning to Branch [12.27934038849211]
ブランチ・アンド・バウンド(B&B)は最適化の一般的な方法である。
本稿では,新しい強化学習に基づくB&Bアルゴリズムを提案する。
提案アルゴリズムの性能を3つの公開研究ベンチマークで評価した。
論文 参考訳(メタデータ) (2022-01-17T04:50:11Z) - BALanCe: Deep Bayesian Active Learning via Equivalence Class Annealing [7.9107076476763885]
BALanCeは、不確実性推定の効果を緩和する、深いアクティブな学習フレームワークである。
Batch-BALanCeは、逐次アルゴリズムのバッチ設定への一般化である。
Batch-BALanCeは、アクティブな学習のためのいくつかのベンチマークデータセット上で最先端のパフォーマンスを実現する。
論文 参考訳(メタデータ) (2021-12-27T15:38:27Z) - Gone Fishing: Neural Active Learning with Fisher Embeddings [55.08537975896764]
ディープニューラルネットワークと互換性のあるアクティブな学習アルゴリズムの必要性が高まっている。
本稿では,ニューラルネットワークのための抽出可能かつ高性能な能動学習アルゴリズムBAITを紹介する。
論文 参考訳(メタデータ) (2021-06-17T17:26:31Z) - Monotonic Cardinality Estimation of Similarity Selection: A Deep
Learning Approach [22.958342743597044]
類似度選択の基数推定にディープラーニングを活用する可能性について検討する。
本稿では,任意のデータ型や距離関数に適用可能な,新規で汎用的な手法を提案する。
論文 参考訳(メタデータ) (2020-02-15T20:22:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。