論文の概要: A Unified Deep Model of Learning from both Data and Queries for
Cardinality Estimation
- arxiv url: http://arxiv.org/abs/2107.12295v1
- Date: Mon, 26 Jul 2021 16:09:58 GMT
- ステータス: 処理完了
- システム内更新日: 2021-07-28 14:31:27.804857
- Title: A Unified Deep Model of Learning from both Data and Queries for
Cardinality Estimation
- Title(参考訳): 心的推定のためのデータとクエリの両方からの学習の統一モデル
- Authors: Peizhi Wu and Gao Cong
- Abstract要約: 本稿では,データと問合せ作業負荷の両方から共同データ分布を学習する統合された深部自己回帰モデルUAEを提案する。
UAEは1桁の乗算誤差を尾で達成し、最先端の手法よりも精度が良く、空間も時間も効率的である。
- 参考スコア(独自算出の注目度): 28.570086492742035
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Cardinality estimation is a fundamental problem in database systems. To
capture the rich joint data distributions of a relational table, most of the
existing work either uses data as unsupervised information or uses query
workload as supervised information. Very little work has been done to use both
types of information, and cannot fully make use of both types of information to
learn the joint data distribution. In this work, we aim to close the gap
between data-driven and query-driven methods by proposing a new unified deep
autoregressive model, UAE, that learns the joint data distribution from both
the data and query workload. First, to enable using the supervised query
information in the deep autoregressive model, we develop differentiable
progressive sampling using the Gumbel-Softmax trick. Second, UAE is able to
utilize both types of information to learn the joint data distribution in a
single model. Comprehensive experimental results demonstrate that UAE achieves
single-digit multiplicative error at tail, better accuracies over
state-of-the-art methods, and is both space and time efficient.
- Abstract(参考訳): カーディナリティ推定はデータベースシステムにおける根本的な問題である。
リレーショナルテーブルのリッチなジョイントデータ分布をキャプチャするために、既存の作業のほとんどは教師なし情報としてデータを使用するか、教師なし情報としてクエリワークロードを使用する。
両タイプの情報を利用するための作業はほとんど行われておらず、共同データ配信を学ぶために両タイプの情報を完全に利用することはできない。
本研究では,データとクエリの両方のワークロードから共同データ分布を学習する統合深層自己回帰モデルUAEを提案することにより,データ駆動型とクエリ駆動型のメソッド間のギャップを埋めることを目的とする。
まず,教師付きクエリ情報を深部自己回帰モデルで有効にするために,Gumbel-Softmax のトリックを用いてプログレッシブサンプリングを行う。
第二に、UAEは2種類の情報を利用して、単一のモデルで共同データ分布を学習することができる。
総合的な実験結果から、UAEは1桁の乗算誤差を尾で達成し、最先端の手法よりも精度が良く、空間と時間の両方が効率的であることが示された。
関連論文リスト
- Relational Deep Learning: Graph Representation Learning on Relational
Databases [69.7008152388055]
複数のテーブルにまたがって配置されたデータを学ぶために、エンドツーエンドの表現アプローチを導入する。
メッセージパッシンググラフニューラルネットワークは、自動的にグラフを学習して、すべてのデータ入力を活用する表現を抽出する。
論文 参考訳(メタデータ) (2023-12-07T18:51:41Z) - ASPER: Answer Set Programming Enhanced Neural Network Models for Joint
Entity-Relation Extraction [11.049915720093242]
本稿では ASP-enhanced Entity-Relation extract (ASPER) という新しいアプローチを提案する。
ASPERは、データとドメインの知識の両方から学習することで、エンティティと関係を共同で認識する。
特に、ASPERはニューラルネットワークモデルの学習プロセスにおいて、事実知識(ASPで事実として表現される)と派生知識(ASPで規則として表現される)を活用する。
論文 参考訳(メタデータ) (2023-05-24T17:32:58Z) - Deep Transfer Learning for Multi-source Entity Linkage via Domain
Adaptation [63.24594955429465]
マルチソースエンティティリンクは、データのクリーニングやユーザ縫合といった、高インパクトなアプリケーションにおいて重要である。
AdaMELは、多ソースエンティティリンクを実行するための一般的なハイレベルな知識を学ぶディープトランスファー学習フレームワークである。
本フレームワークは,教師付き学習に基づく平均的手法よりも8.21%向上した最先端の学習結果を実現する。
論文 参考訳(メタデータ) (2021-10-27T15:20:41Z) - Dataset Cartography: Mapping and Diagnosing Datasets with Training
Dynamics [118.75207687144817]
我々はデータセットを特徴付け、診断するモデルベースのツールであるData Mapsを紹介した。
私たちは、トレーニング中の個々のインスタンス上でのモデルの振る舞いという、ほとんど無視された情報のソースを活用しています。
以上の結果から,データ量から品質へのフォーカスの変化は,ロバストなモデルとアウト・オブ・ディストリビューションの一般化に繋がる可能性が示唆された。
論文 参考訳(メタデータ) (2020-09-22T20:19:41Z) - Dual-Teacher: Integrating Intra-domain and Inter-domain Teachers for
Annotation-efficient Cardiac Segmentation [65.81546955181781]
本稿では,新しい半教師付きドメイン適応手法,すなわちDual-Teacherを提案する。
学生モデルは、2つの教師モデルによってラベル付けされていない対象データとラベル付けされた情報源データの知識を学習する。
提案手法では, ラベルなしデータとモダリティ間データとを並列に利用でき, 性能が向上することを示した。
論文 参考訳(メタデータ) (2020-07-13T10:00:44Z) - Relation-Guided Representation Learning [53.60351496449232]
本稿では,サンプル関係を明示的にモデル化し,活用する表現学習手法を提案する。
私たちのフレームワークは、サンプル間の関係をよく保存します。
サンプルをサブスペースに埋め込むことにより,本手法が大規模なサンプル外問題に対処可能であることを示す。
論文 参考訳(メタデータ) (2020-07-11T10:57:45Z) - Multi-Center Federated Learning [62.57229809407692]
本稿では,フェデレート学習のための新しい多中心集約機構を提案する。
非IIDユーザデータから複数のグローバルモデルを学び、同時にユーザとセンタ間の最適なマッチングを導出する。
ベンチマークデータセットによる実験結果から,本手法はいくつかの一般的なフェデレーション学習法より優れていることが示された。
論文 参考訳(メタデータ) (2020-05-03T09:14:31Z) - Have you forgotten? A method to assess if machine learning models have
forgotten data [20.9131206112401]
ディープラーニングの時代において、複数のソースからのデータの集約は、データの多様性を保証するための一般的なアプローチである。
本稿では、モデルによってデータが忘れられたかどうかという課題に対処する。
我々は、ターゲットの出力と異なるデータセットで訓練されたモデルの出力を比較する統計的手法を確立する。
論文 参考訳(メタデータ) (2020-04-21T16:13:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。