論文の概要: Monotonic Cardinality Estimation of Similarity Selection: A Deep
Learning Approach
- arxiv url: http://arxiv.org/abs/2002.06442v4
- Date: Fri, 24 Sep 2021 16:51:44 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-31 23:11:52.120895
- Title: Monotonic Cardinality Estimation of Similarity Selection: A Deep
Learning Approach
- Title(参考訳): 類似度選択の単調心電図推定 : 深層学習アプローチ
- Authors: Yaoshu Wang, Chuan Xiao, Jianbin Qin, Xin Cao, Yifang Sun, Wei Wang,
and Makoto Onizuka
- Abstract要約: 類似度選択の基数推定にディープラーニングを活用する可能性について検討する。
本稿では,任意のデータ型や距離関数に適用可能な,新規で汎用的な手法を提案する。
- 参考スコア(独自算出の注目度): 22.958342743597044
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Due to the outstanding capability of capturing underlying data distributions,
deep learning techniques have been recently utilized for a series of
traditional database problems. In this paper, we investigate the possibilities
of utilizing deep learning for cardinality estimation of similarity selection.
Answering this problem accurately and efficiently is essential to many data
management applications, especially for query optimization. Moreover, in some
applications the estimated cardinality is supposed to be consistent and
interpretable. Hence a monotonic estimation w.r.t. the query threshold is
preferred. We propose a novel and generic method that can be applied to any
data type and distance function. Our method consists of a feature extraction
model and a regression model. The feature extraction model transforms original
data and threshold to a Hamming space, in which a deep learning-based
regression model is utilized to exploit the incremental property of cardinality
w.r.t. the threshold for both accuracy and monotonicity. We develop a training
strategy tailored to our model as well as techniques for fast estimation. We
also discuss how to handle updates. We demonstrate the accuracy and the
efficiency of our method through experiments, and show how it improves the
performance of a query optimizer.
- Abstract(参考訳): 基礎となるデータ分布をキャプチャする優れた能力のため、ディープラーニング技術は最近、一連の従来のデータベース問題に利用されてきた。
本稿では,類似度選択の基数推定にディープラーニングを活用する可能性を検討する。
この問題を正確かつ効率的に答えることは、多くのデータ管理アプリケーション、特にクエリ最適化に不可欠である。
さらに、いくつかの応用では、推定濃度は一貫性があり、解釈可能である。
したがって、単調推定w.r.t.ではクエリしきい値が好ましい。
任意のデータ型と距離関数に適用可能な新規で汎用的な手法を提案する。
本手法は特徴抽出モデルと回帰モデルからなる。
特徴抽出モデルは元のデータと閾値をハミング空間に変換し、深層学習に基づく回帰モデルを用いて濃度w.r.t.のインクリメンタル特性を精度と単調性の両方に活用する。
我々は,モデルに適したトレーニング戦略と迅速な推定手法を開発する。
アップデートの扱い方も議論します。
実験によって提案手法の精度と効率を実証し,クエリオプティマイザの性能をいかに向上させるかを示す。
関連論文リスト
- CardBench: A Benchmark for Learned Cardinality Estimation in Relational Databases [17.46316633654637]
データベースにおける高いクエリパフォーマンスを実現するには、心臓病推定が不可欠である。
研究者が新しい学習アプローチによる進捗を評価することができるような、体系的なベンチマークやデータセットは存在しない。
我々は,20の異なる実世界のデータベースに数千のクエリを格納したベンチマークを,学習された濃度推定のためにリリースした。
論文 参考訳(メタデータ) (2024-08-28T23:25:25Z) - Efficient and Generalizable Certified Unlearning: A Hessian-free Recollection Approach [8.875278412741695]
機械学習は、特定のデータを選択的に忘れることを可能にして、データ所有者の権利を忘れないように努力する。
我々は,ベクトル加算操作のみを必要とするため,ほぼ瞬時に未学習を実現するアルゴリズムを開発した。
論文 参考訳(メタデータ) (2024-04-02T07:54:18Z) - Consensus-Adaptive RANSAC [104.87576373187426]
本稿では,パラメータ空間の探索を学習する新しいRANSACフレームワークを提案する。
注意機構は、ポイント・ツー・モデル残差のバッチで動作し、軽量のワンステップ・トランスフォーマーで見いだされたコンセンサスを考慮するために、ポイント・ツー・モデル推定状態を更新する。
論文 参考訳(メタデータ) (2023-07-26T08:25:46Z) - HyperImpute: Generalized Iterative Imputation with Automatic Model
Selection [77.86861638371926]
カラムワイズモデルを適応的かつ自動的に構成するための一般化反復計算フレームワークを提案する。
既製の学習者,シミュレータ,インターフェースを備えた具体的な実装を提供する。
論文 参考訳(メタデータ) (2022-06-15T19:10:35Z) - Invariance Learning in Deep Neural Networks with Differentiable Laplace
Approximations [76.82124752950148]
我々はデータ拡張を選択するための便利な勾配法を開発した。
我々はKronecker-factored Laplace近似を我々の目的とする限界確率に近似する。
論文 参考訳(メタデータ) (2022-02-22T02:51:11Z) - Practical Active Learning with Model Selection for Small Data [13.128648437690224]
モデル選択を用いた実践的能動的学習のための簡易かつ高速な手法を開発した。
本手法は,ラジアル基底関数カーネルを用いたサポートベクトル分類を用いて,二元分類のためのプールベースアクティブラーナに基づく。
論文 参考訳(メタデータ) (2021-12-21T23:11:27Z) - X-model: Improving Data Efficiency in Deep Learning with A Minimax Model [78.55482897452417]
ディープラーニングにおける分類と回帰設定の両面でのデータ効率の向上を目標とする。
両世界の力を生かすために,我々は新しいX-モデルを提案する。
X-モデルは、特徴抽出器とタスク固有のヘッドの間でミニマックスゲームを行う。
論文 参考訳(メタデータ) (2021-10-09T13:56:48Z) - Model-agnostic and Scalable Counterfactual Explanations via
Reinforcement Learning [0.5729426778193398]
本稿では,最適化手順をエンドツーエンドの学習プロセスに変換する深層強化学習手法を提案する。
実世界のデータを用いた実験により,本手法はモデルに依存しず,モデル予測からのフィードバックのみに依存することがわかった。
論文 参考訳(メタデータ) (2021-06-04T16:54:36Z) - Scalable Marginal Likelihood Estimation for Model Selection in Deep
Learning [78.83598532168256]
階層型モデル選択は、推定困難のため、ディープラーニングではほとんど使われない。
本研究は,検証データが利用できない場合,限界的可能性によって一般化が向上し,有用であることを示す。
論文 参考訳(メタデータ) (2021-04-11T09:50:24Z) - Probabilistic Case-based Reasoning for Open-World Knowledge Graph
Completion [59.549664231655726]
ケースベース推論(CBR)システムは,与えられた問題に類似した事例を検索することで,新たな問題を解決する。
本稿では,知識ベース(KB)の推論において,そのようなシステムが実現可能であることを示す。
提案手法は,KB内の類似エンティティからの推論パスを収集することにより,エンティティの属性を予測する。
論文 参考訳(メタデータ) (2020-10-07T17:48:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。