論文の概要: Electra: Conditional Generative Model based Predicate-Aware Query
Approximation
- arxiv url: http://arxiv.org/abs/2201.12420v1
- Date: Fri, 28 Jan 2022 21:13:26 GMT
- ステータス: 処理完了
- システム内更新日: 2022-02-01 17:56:46.800588
- Title: Electra: Conditional Generative Model based Predicate-Aware Query
Approximation
- Title(参考訳): Electra: 条件付き生成モデルに基づく述語対応クエリ近似
- Authors: Nikhil Sheoran, Subrata Mitra, Vibhor Porwal, Siddharth Ghetia, Jatin
Varshney, Tung Mai, Anup Rao, Vikas Maddukuri
- Abstract要約: ELECTRAは述語対応のAQPシステムで、多くの述語で分析スタイルのクエリに答えることができ、近似誤差ははるかに小さい。
実世界の3つのデータセットに対する4つの異なるベースラインによる評価の結果,ELECTRAはベースラインと比較して多数の述語に対して低いAQP誤差を提供することがわかった。
- 参考スコア(独自算出の注目度): 10.056919500568013
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The goal of Approximate Query Processing (AQP) is to provide very fast but
"accurate enough" results for costly aggregate queries thereby improving user
experience in interactive exploration of large datasets. Recently proposed
Machine-Learning based AQP techniques can provide very low latency as query
execution only involves model inference as compared to traditional query
processing on database clusters. However, with increase in the number of
filtering predicates(WHERE clauses), the approximation error significantly
increases for these methods. Analysts often use queries with a large number of
predicates for insights discovery. Thus, maintaining low approximation error is
important to prevent analysts from drawing misleading conclusions. In this
paper, we propose ELECTRA, a predicate-aware AQP system that can answer
analytics-style queries with a large number of predicates with much smaller
approximation errors. ELECTRA uses a conditional generative model that learns
the conditional distribution of the data and at runtime generates a small
(~1000 rows) but representative sample, on which the query is executed to
compute the approximate result. Our evaluations with four different baselines
on three real-world datasets show that ELECTRA provides lower AQP error for
large number of predicates compared to baselines.
- Abstract(参考訳): Approximate Query Processing(AQP)の目標は、クエリをコスト的に集約する上で、非常に高速だが“十分正確な”結果を提供することで、大規模なデータセットのインタラクティブな探索におけるユーザエクスペリエンスを向上させることだ。
最近提案された機械学習ベースのaqp技術は、クエリの実行が従来のデータベースクラスタでのクエリ処理と比較してモデル推論のみを伴うため、非常に低いレイテンシを提供することができる。
しかし、フィルタ述語(WHERE節)の数が増加すると、近似誤差はこれらの手法で著しく増加する。
アナリストは洞察の発見に多くの述語を使ったクエリを使うことが多い。
したがって、アナリストが誤った結論を出すのを防ぐためには、低い近似誤差を維持することが重要である。
本稿では,より少ない近似誤差で多数の述語を用いた分析式クエリに応答できる述語認識型AQPシステムであるELECTRAを提案する。
electraは条件付き生成モデルを使用して、データの条件付き分布を学習し、実行時に小さな(約1000行)だが代表的なサンプルを生成し、クエリを実行して近似結果を計算する。
実世界の3つのデータセットに対する4つの異なるベースラインによる評価の結果,ELECTRAはベースラインと比較して多数の述語に対して低いAQP誤差を提供することがわかった。
関連論文リスト
- MeaeQ: Mount Model Extraction Attacks with Efficient Queries [6.1106195466129485]
自然言語処理(NLP)におけるモデル抽出攻撃の研究
これらの問題に対処する単純で効果的な方法であるMeaeQを提案する。
MeaeQは、クエリを少なくしながら、ベースラインよりも犠牲者モデルに高い機能的類似性を実現する。
論文 参考訳(メタデータ) (2023-10-21T16:07:16Z) - MinPrompt: Graph-based Minimal Prompt Data Augmentation for Few-shot
Question Answering [68.52980461474752]
オープンドメイン質問応答のための最小限のデータ拡張フレームワークMinPromptを提案する。
我々は、生テキストをグラフ構造に変換し、異なる事実文間の接続を構築する。
次に、グラフアルゴリズムを適用して、原文のほとんどの情報をカバーするのに必要な最小限の文の集合を識別する。
同定された文サブセットに基づいてQAペアを生成し、選択した文に基づいてモデルをトレーニングし、最終モデルを得る。
論文 参考訳(メタデータ) (2023-10-08T04:44:36Z) - Improving Text Matching in E-Commerce Search with A Rationalizable,
Intervenable and Fast Entity-Based Relevance Model [78.80174696043021]
エンティティベース関連モデル(EBRM)と呼ばれる新しいモデルを提案する。
この分解により、高精度にクロスエンコーダQE関連モジュールを使用できる。
また、ユーザログから自動生成されたQEデータによるQEモジュールの事前トレーニングにより、全体的なパフォーマンスが向上することを示す。
論文 参考訳(メタデータ) (2023-07-01T15:44:53Z) - Kepler: Robust Learning for Faster Parametric Query Optimization [5.6119420695093245]
パラメトリッククエリ最適化のためのエンドツーエンドの学習ベースアプローチを提案する。
Keplerは、複数のデータセット上でのクエリランタイムの大幅な改善を実現している。
論文 参考訳(メタデータ) (2023-06-11T22:39:28Z) - Single-Stage Visual Relationship Learning using Conditional Queries [60.90880759475021]
TraCQは、マルチタスク学習問題とエンティティペアの分布を回避する、シーングラフ生成の新しい定式化である。
我々は,DETRをベースとしたエンコーダ-デコーダ条件付きクエリを用いて,エンティティラベル空間を大幅に削減する。
実験結果から、TraCQは既存のシングルステージシーングラフ生成法よりも優れており、Visual Genomeデータセットの最先端の2段階メソッドを多く上回っていることがわかった。
論文 参考訳(メタデータ) (2023-06-09T06:02:01Z) - Knowledge Base Question Answering by Case-based Reasoning over Subgraphs [81.22050011503933]
本モデルでは,既存のKG補完アルゴリズムよりも複雑な推論パターンを必要とする問合せに対して,より効果的に答えることを示す。
提案モデルは、KBQAベンチマークの最先端モデルよりも優れているか、競合的に動作する。
論文 参考訳(メタデータ) (2022-02-22T01:34:35Z) - Learning Query Expansion over the Nearest Neighbor Graph [94.80212602202518]
グラフクエリ拡張(GQE)が提示され、教師付き方法で学習され、クエリの拡張近傍で集約を実行する。
この技術は既知のベンチマークよりも最先端の結果が得られる。
論文 参考訳(メタデータ) (2021-12-05T19:48:42Z) - Approximate Query Processing for Group-By Queries based on Conditional
Generative Models [3.9837198605506963]
グループバイクエリには複数の値が含まれるため、すべてのグループに対して十分な正確な推定を行うのは難しい。
階層化サンプリングは、一様サンプリングに比べて精度が向上するが、特定のクエリで選択されたサンプルは他のクエリでは動作しない。
オンラインサンプリングは、クエリ時に与えられたクエリのサンプルを選択するが、長いレイテンシを必要とする。
提案フレームワークは階層化サンプリングとオンラインアグリゲーションを組み合わせることで,グループバイクエリの推定精度を向上させることができる。
論文 参考訳(メタデータ) (2021-01-08T08:49:21Z) - DeepSampling: Selectivity Estimation with Predicted Error and Response
Time [7.23389716633927]
本稿では,サンプルベースAQPアルゴリズムの精度を予測するディープラーニングモデルであるDeepSamplingを提案する。
DeepSamplingは、既存の空間データベースがAQPの精度を制御するための信頼性の高いツールを提供する最初のシステムである。
論文 参考訳(メタデータ) (2020-08-16T03:23:01Z) - Multi-layer Optimizations for End-to-End Data Analytics [71.05611866288196]
代替アプローチを実現するフレームワークであるIFAQ(Iterative Functional Aggregate Queries)を紹介する。
IFAQは、特徴抽出クエリと学習タスクを、IFAQのドメイン固有言語で与えられた1つのプログラムとして扱う。
IFAQ の Scala 実装が mlpack,Scikit,特殊化を数桁で上回り,線形回帰木モデルや回帰木モデルを複数の関係データセット上で処理可能であることを示す。
論文 参考訳(メタデータ) (2020-01-10T16:14:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。