論文の概要: "What makes my queries slow?": Subgroup Discovery for SQL Workload
Analysis
- arxiv url: http://arxiv.org/abs/2108.03906v1
- Date: Mon, 9 Aug 2021 09:44:13 GMT
- ステータス: 処理完了
- システム内更新日: 2021-08-10 15:05:39.291175
- Title: "What makes my queries slow?": Subgroup Discovery for SQL Workload
Analysis
- Title(参考訳): 「クエリが遅いのはなぜですか?
SQLワークロード分析のためのサブグループディスカバリ
- Authors: Youcef Remil, Anes Bendimerad, Romain Mathonat, Philippe Chaleat,
Mehdi Kaytoue
- Abstract要約: サブグループディスカバリーに根ざした独自のアプローチを導入する。
この汎用データマイニングフレームワークのインスタンス化と開発方法を示す。
インタラクティブな知識発見のための可視化ツールも提供しています。
- 参考スコア(独自算出の注目度): 1.3124513975412255
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Among daily tasks of database administrators (DBAs), the analysis of query
workloads to identify schema issues and improving performances is crucial.
Although DBAs can easily pinpoint queries repeatedly causing performance
issues, it remains challenging to automatically identify subsets of queries
that share some properties only (a pattern) and simultaneously foster some
target measures, such as execution time. Patterns are defined on combinations
of query clauses, environment variables, database alerts and metrics and help
answer questions like what makes SQL queries slow? What makes I/O
communications high? Automatically discovering these patterns in a huge search
space and providing them as hypotheses for helping to localize issues and
root-causes is important in the context of explainable AI. To tackle it, we
introduce an original approach rooted on Subgroup Discovery. We show how to
instantiate and develop this generic data-mining framework to identify
potential causes of SQL workloads issues. We believe that such data-mining
technique is not trivial to apply for DBAs. As such, we also provide a
visualization tool for interactive knowledge discovery. We analyse a one week
workload from hundreds of databases from our company, make both the dataset and
source code available, and experimentally show that insightful hypotheses can
be discovered.
- Abstract(参考訳): データベース管理者(DBA)の日々のタスクの中で、スキーマの問題を特定し、パフォーマンスを改善するためのクエリワークロードの分析が重要である。
DBAは、繰り返しパフォーマンス問題を引き起こすクエリを特定できるが、いくつかのプロパティ(パターン)のみを共有するクエリのサブセットを自動的に識別し、実行時間などのいくつかの目標措置を同時に促進することは、依然として困難である。
パターンはクエリ句、環境変数、データベースアラート、メトリクスの組み合わせで定義され、SQLクエリが遅い理由のような質問に答えるのに役立ちますか?
I/O通信はなぜ高いのか?
巨大な検索空間でこれらのパターンを自動的に発見し、問題や根本原因をローカライズするための仮説として提供することは、説明可能なAIの文脈において重要である。
そこで本研究では,サブグループ発見を基盤としたアプローチを提案する。
SQLワークロード問題の潜在的な原因を特定するために、この汎用データマイニングフレームワークのインスタンス化と開発方法を示す。
このようなデータマイニング技術はDBAに適用するのは簡単ではないと考えています。
また,インタラクティブな知識発見のための可視化ツールも提供する。
当社の数百のデータベースから1週間のワークロードを分析し、データセットとソースコードの両方を利用可能にし、洞察に富んだ仮説が発見できることを実験的に示します。
関連論文リスト
- PTD-SQL: Partitioning and Targeted Drilling with LLMs in Text-to-SQL [54.304872649870575]
大規模言語モデル(LLM)は、テキスト・トゥ・センス・タスクの強力なツールとして登場した。
本研究では,クエリグループパーティショニングを用いることで,単一問題に特有の思考プロセスの学習に集中できることを示す。
論文 参考訳(メタデータ) (2024-09-21T09:33:14Z) - Text2SQL is Not Enough: Unifying AI and Databases with TAG [47.45480855418987]
Table-Augmented Generation (TAG) は、データベース上の自然言語の質問に答えるパラダイムである。
我々は、TAG問題を研究するためのベンチマークを開発し、標準手法がクエリの20%以上を正しく答えることを発見した。
論文 参考訳(メタデータ) (2024-08-27T00:50:14Z) - AMBROSIA: A Benchmark for Parsing Ambiguous Questions into Database Queries [56.82807063333088]
我々は,新たなベンチマークであるAMBROSIAを導入し,テキスト・ツー・オープン・プログラムの開発を促進することを期待する。
私たちのデータセットには、3種類のあいまいさ(スコープのあいまいさ、アタッチメントのあいまいさ、あいまいさ)を示す質問が含まれている。
いずれの場合も、データベースのコンテキストが提供されてもあいまいさは持続する。
これは、スクラッチからデータベースを制御して生成する、新しいアプローチによって実現される。
論文 参考訳(メタデータ) (2024-06-27T10:43:04Z) - Database-Augmented Query Representation for Information Retrieval [59.57065228857247]
データベース拡張クエリ表現(DAQu)と呼ばれる新しい検索フレームワークを提案する。
DAQuは、元のクエリを複数のテーブルにまたがるさまざまな(クエリ関連の)メタデータで拡張する。
リレーショナルデータベースのメタデータを組み込む様々な検索シナリオにおいてDAQuを検証する。
論文 参考訳(メタデータ) (2024-06-23T05:02:21Z) - FeatAug: Automatic Feature Augmentation From One-to-Many Relationship Tables [4.058220332950672]
1対多の関係テーブルの機能強化は、MLモデル開発において重要な問題であるが、難しい問題である。
本稿では,1対多の関係テーブルから述語クエリを自動的に抽出する機能拡張フレームワークFEATAUGを提案する。
FeatAugがFeattoolsよりも効果的な特徴を抽出できることを実世界の4つのデータセットで実証した。
論文 参考訳(メタデータ) (2024-03-11T01:44:14Z) - Testing Database Engines via Query Plan Guidance [6.789710498230718]
本稿では,自動テストの"興味深い"テストケースへの誘導を目的としたクエリプランガイダンス(QPG)の概念を提案する。
我々は,成熟した,広く使用されている,多様なデータベースシステム –DBite,TiDB,Cockroach – に適用した。
論文 参考訳(メタデータ) (2023-12-29T08:09:47Z) - Searching for Better Database Queries in the Outputs of Semantic Parsers [16.221439565760058]
本稿では,テスト時に生成したクエリを評価する外部基準にアクセスできる場合を考える。
クエリがエラーなしに実行されることをチェックすることから、一連のテストでクエリを検証することまで、その基準は様々である。
我々は、最先端のセマンティクスにアプローチを適用し、異なるデータセットですべてのテストを通過する多くのクエリを見つけることができると報告します。
論文 参考訳(メタデータ) (2022-10-13T17:20:45Z) - Graph Enhanced BERT for Query Understanding [55.90334539898102]
クエリ理解は、ユーザの検索意図を探索し、ユーザが最も望まれる情報を発見できるようにする上で、重要な役割を果たす。
近年、プレトレーニング言語モデル (PLM) は様々な自然言語処理タスクを進歩させてきた。
本稿では,クエリコンテンツとクエリグラフの両方を活用可能な,グラフ強化事前学習フレームワークGE-BERTを提案する。
論文 参考訳(メタデータ) (2022-04-03T16:50:30Z) - A Benchmark for Generalizable and Interpretable Temporal Question
Answering over Knowledge Bases [67.33560134350427]
TempQA-WDは時間的推論のためのベンチマークデータセットである。
Wikidataは、最も頻繁にキュレーションされ、公開されている知識ベースである。
論文 参考訳(メタデータ) (2022-01-15T08:49:09Z) - Dual Reader-Parser on Hybrid Textual and Tabular Evidence for Open
Domain Question Answering [78.9863753810787]
世界の知識は構造化データベースに保存されている。
クエリ言語は、複雑な推論を必要とする質問に答えるだけでなく、完全な説明可能性を提供することができる。
論文 参考訳(メタデータ) (2021-08-05T22:04:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。