Fugu-MT 論文翻訳(概要): "What makes my queries slow?": Subgroup Discovery for SQL Workload Analysis

論文の概要: "What makes my queries slow?": Subgroup Discovery for SQL Workload Analysis

arxiv url: http://arxiv.org/abs/2108.03906v1
Date: Mon, 9 Aug 2021 09:44:13 GMT
ステータス: 翻訳完了
システム内更新日: 2021-08-10 15:05:39.291175
Title: "What makes my queries slow?": Subgroup Discovery for SQL Workload Analysis
Title（参考訳）: 「クエリが遅いのはなぜですか? SQLワークロード分析のためのサブグループディスカバリ
Authors: Youcef Remil, Anes Bendimerad, Romain Mathonat, Philippe Chaleat, Mehdi Kaytoue
Abstract要約: サブグループディスカバリーに根ざした独自のアプローチを導入する。この汎用データマイニングフレームワークのインスタンス化と開発方法を示す。インタラクティブな知識発見のための可視化ツールも提供しています。
参考スコア（独自算出の注目度）: 1.3124513975412255
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Among daily tasks of database administrators (DBAs), the analysis of query workloads to identify schema issues and improving performances is crucial. Although DBAs can easily pinpoint queries repeatedly causing performance issues, it remains challenging to automatically identify subsets of queries that share some properties only (a pattern) and simultaneously foster some target measures, such as execution time. Patterns are defined on combinations of query clauses, environment variables, database alerts and metrics and help answer questions like what makes SQL queries slow? What makes I/O communications high? Automatically discovering these patterns in a huge search space and providing them as hypotheses for helping to localize issues and root-causes is important in the context of explainable AI. To tackle it, we introduce an original approach rooted on Subgroup Discovery. We show how to instantiate and develop this generic data-mining framework to identify potential causes of SQL workloads issues. We believe that such data-mining technique is not trivial to apply for DBAs. As such, we also provide a visualization tool for interactive knowledge discovery. We analyse a one week workload from hundreds of databases from our company, make both the dataset and source code available, and experimentally show that insightful hypotheses can be discovered.
Abstract（参考訳）: データベース管理者(DBA)の日々のタスクの中で、スキーマの問題を特定し、パフォーマンスを改善するためのクエリワークロードの分析が重要である。 DBAは、繰り返しパフォーマンス問題を引き起こすクエリを特定できるが、いくつかのプロパティ(パターン)のみを共有するクエリのサブセットを自動的に識別し、実行時間などのいくつかの目標措置を同時に促進することは、依然として困難である。パターンはクエリ句、環境変数、データベースアラート、メトリクスの組み合わせで定義され、SQLクエリが遅い理由のような質問に答えるのに役立ちますか? I/O通信はなぜ高いのか? 巨大な検索空間でこれらのパターンを自動的に発見し、問題や根本原因をローカライズするための仮説として提供することは、説明可能なAIの文脈において重要である。そこで本研究では,サブグループ発見を基盤としたアプローチを提案する。 SQLワークロード問題の潜在的な原因を特定するために、この汎用データマイニングフレームワークのインスタンス化と開発方法を示す。このようなデータマイニング技術はDBAに適用するのは簡単ではないと考えています。また,インタラクティブな知識発見のための可視化ツールも提供する。当社の数百のデータベースから1週間のワークロードを分析し、データセットとソースコードの両方を利用可能にし、洞察に富んだ仮説が発見できることを実験的に示します。

関連論文リスト

Beyond Caption-Based Queries for Video Moment Retrieval [60.31221310786333]
キャプションベースのクエリでトレーニングしたVMR手法の劣化について検討するが,検索クエリで評価した。 3つのパブリックVMRデータセットでテキストクエリを変更することで、3つのベンチマークを導入する。提案手法は,検索クエリの性能を最大14.82% mAP_m,マルチモーメント検索クエリ最大21.83% mAP_mで改善する。
論文参考訳（メタデータ） (2026-03-02T20:06:41Z)
From Queries to Insights: Agentic LLM Pipelines for Spatio-Temporal Text-to-SQL [8.496933324334167]
本研究では,MistralをベースとしたRellama-sqlcoder-8bによるオーケストレーションにより,簡単なテキストからActまでのベースライン(Rellama-sqlcoder-8b)を提案する。ニューヨークと東京のチェックインで35の自然言語クエリを評価し,空間的・時間的マルチデータセット推論について検討した。このエージェントは、データセット 91.4% 対 28.6% よりもかなり精度が高く、地図によるユーザビリティを高め、自然言語の要約を構造化する。
論文参考訳（メタデータ） (2025-10-29T22:18:57Z)
STARQA: A Question Answering Dataset for Complex Analytical Reasoning over Structured Databases [27.66819120859756]
SARQAは,3つの特殊リレーショナル・ドメイン・データベース上での複雑な解析的推論質問と回答の公開人為的データセットである。本稿では,3つの特殊リレーショナル・ドメイン・データベース上での複雑な解析的推論質問と回答の公開人為的データセットであるSTARQAを紹介する。
論文参考訳（メタデータ） (2025-09-23T19:26:16Z)
Weaver: Interweaving SQL and LLM for Table Reasoning [63.09519234853953]
Weaverは、構造化データ検索のためのsqlとセマンティック処理のためのLLMを組み合わせたフレキシブルなステップバイステッププランを生成する。 Weaverは、4つのTableQAデータセットの最先端メソッドを一貫して上回り、API呼び出しとエラー率の両方を削減する。
論文参考訳（メタデータ） (2025-05-25T03:27:37Z)
Exploring the Use of LLMs for SQL Equivalence Checking [15.42143912008553]
2sqlクエリの等価チェックは難解な問題である。既存の方法は、有界同値チェックであっても、sqlの小さなサブセットのみを扱うことができる。本稿では,大言語モデル (LLM) が withsql クエリを推論する能力を示すことができるかどうかを考察する。
論文参考訳（メタデータ） (2024-12-07T06:50:12Z)
PTD-SQL: Partitioning and Targeted Drilling with LLMs in Text-to-SQL [54.304872649870575]
大規模言語モデル(LLM)は、テキスト・トゥ・センス・タスクの強力なツールとして登場した。本研究では,クエリグループパーティショニングを用いることで,単一問題に特有の思考プロセスの学習に集中できることを示す。
論文参考訳（メタデータ） (2024-09-21T09:33:14Z)
Text2SQL is Not Enough: Unifying AI and Databases with TAG [47.45480855418987]
Table-Augmented Generation (TAG) は、データベース上の自然言語の質問に答えるパラダイムである。我々は、TAG問題を研究するためのベンチマークを開発し、標準手法がクエリの20%以上を正しく答えることを発見した。
論文参考訳（メタデータ） (2024-08-27T00:50:14Z)
AMBROSIA: A Benchmark for Parsing Ambiguous Questions into Database Queries [56.82807063333088]
我々は,新たなベンチマークであるAMBROSIAを導入し,テキスト・ツー・オープン・プログラムの開発を促進することを期待する。私たちのデータセットには、3種類のあいまいさ(スコープのあいまいさ、アタッチメントのあいまいさ、あいまいさ)を示す質問が含まれている。いずれの場合も、データベースのコンテキストが提供されてもあいまいさは持続する。これは、スクラッチからデータベースを制御して生成する、新しいアプローチによって実現される。
論文参考訳（メタデータ） (2024-06-27T10:43:04Z)
Database-Augmented Query Representation for Information Retrieval [59.57065228857247]
データベース拡張クエリ表現(DAQu)と呼ばれる新しい検索フレームワークを提案する。 DAQuは、元のクエリを複数のテーブルにまたがるさまざまな(クエリ関連の)メタデータで拡張する。リレーショナルデータベースのメタデータを組み込む様々な検索シナリオにおいてDAQuを検証する。
論文参考訳（メタデータ） (2024-06-23T05:02:21Z)
FeatAug: Automatic Feature Augmentation From One-to-Many Relationship Tables [4.058220332950672]
1対多の関係テーブルの機能強化は、MLモデル開発において重要な問題であるが、難しい問題である。本稿では,1対多の関係テーブルから述語クエリを自動的に抽出する機能拡張フレームワークFEATAUGを提案する。 FeatAugがFeattoolsよりも効果的な特徴を抽出できることを実世界の4つのデータセットで実証した。
論文参考訳（メタデータ） (2024-03-11T01:44:14Z)
Testing Database Engines via Query Plan Guidance [6.789710498230718]
本稿では,自動テストの"興味深い"テストケースへの誘導を目的としたクエリプランガイダンス(QPG)の概念を提案する。我々は,成熟した,広く使用されている,多様なデータベースシステム –DBite,TiDB,Cockroach – に適用した。
論文参考訳（メタデータ） (2023-12-29T08:09:47Z)
Searching for Better Database Queries in the Outputs of Semantic Parsers [16.221439565760058]
本稿では,テスト時に生成したクエリを評価する外部基準にアクセスできる場合を考える。クエリがエラーなしに実行されることをチェックすることから、一連のテストでクエリを検証することまで、その基準は様々である。我々は、最先端のセマンティクスにアプローチを適用し、異なるデータセットですべてのテストを通過する多くのクエリを見つけることができると報告します。
論文参考訳（メタデータ） (2022-10-13T17:20:45Z)
Graph Enhanced BERT for Query Understanding [55.90334539898102]
クエリ理解は、ユーザの検索意図を探索し、ユーザが最も望まれる情報を発見できるようにする上で、重要な役割を果たす。近年、プレトレーニング言語モデル (PLM) は様々な自然言語処理タスクを進歩させてきた。本稿では,クエリコンテンツとクエリグラフの両方を活用可能な,グラフ強化事前学習フレームワークGE-BERTを提案する。
論文参考訳（メタデータ） (2022-04-03T16:50:30Z)
A Benchmark for Generalizable and Interpretable Temporal Question Answering over Knowledge Bases [67.33560134350427]
TempQA-WDは時間的推論のためのベンチマークデータセットである。 Wikidataは、最も頻繁にキュレーションされ、公開されている知識ベースである。
論文参考訳（メタデータ） (2022-01-15T08:49:09Z)
Dual Reader-Parser on Hybrid Textual and Tabular Evidence for Open Domain Question Answering [78.9863753810787]
世界の知識は構造化データベースに保存されている。クエリ言語は、複雑な推論を必要とする質問に答えるだけでなく、完全な説明可能性を提供することができる。
論文参考訳（メタデータ） (2021-08-05T22:04:13Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。