論文の概要: Text to Query Plans for Question Answering on Large Tables
- arxiv url: http://arxiv.org/abs/2508.18758v1
- Date: Tue, 26 Aug 2025 07:35:26 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-27 17:42:38.730102
- Title: Text to Query Plans for Question Answering on Large Tables
- Title(参考訳): 大規模テーブル上での質問応答のための問合せプラン
- Authors: Yipeng Zhang, Chen Wang, Yuzhe Zhang, Jacky Jiang,
- Abstract要約: 本稿では,自然言語クエリをクエリ計画に変換する新しいフレームワークを提案する。
主成分分析や異常検出などの複雑な解析機能を実現する。
我々は、標準データベースと大規模科学表の両方の実験を通じて、我々のフレームワークを検証する。
- 参考スコア(独自算出の注目度): 4.917892629916144
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Efficient querying and analysis of large tabular datasets remain significant challenges, especially for users without expertise in programming languages like SQL. Text-to-SQL approaches have shown promising performance on benchmark data; however, they inherit SQL's drawbacks, including inefficiency with large datasets and limited support for complex data analyses beyond basic querying. We propose a novel framework that transforms natural language queries into query plans. Our solution is implemented outside traditional databases, allowing us to support classical SQL commands while avoiding SQL's inherent limitations. Additionally, we enable complex analytical functions, such as principal component analysis and anomaly detection, providing greater flexibility and extensibility than traditional SQL capabilities. We leverage LLMs to iteratively interpret queries and construct operation sequences, addressing computational complexity by incrementally building solutions. By executing operations directly on the data, we overcome context length limitations without requiring the entire dataset to be processed by the model. We validate our framework through experiments on both standard databases and large scientific tables, demonstrating its effectiveness in handling extensive datasets and performing sophisticated data analyses.
- Abstract(参考訳): 大規模なグラフデータセットの効率的なクエリと分析は、特にSQLのようなプログラミング言語の専門知識を持たないユーザにとって、依然として大きな課題である。
テキストからSQLへのアプローチは、ベンチマークデータに対して有望なパフォーマンスを示しているが、大規模なデータセットとの非効率性や、基本的なクエリ以外の複雑なデータ分析の制限など、SQLの欠点を継承している。
本稿では,自然言語クエリをクエリ計画に変換する新しいフレームワークを提案する。
私たちのソリューションは従来のデータベース以外で実装されており、SQL固有の制限を避けながら、古典的なSQLコマンドをサポートすることができます。
さらに、主成分分析や異常検出などの複雑な分析機能を実現し、従来のSQL機能よりも柔軟性と拡張性を高めます。
我々は LLM を利用して、反復的にクエリを解釈し、演算シーケンスを構築し、漸進的にソリューションを構築することで計算複雑性に対処する。
データ上で直接操作を行うことで、データセット全体をモデルで処理することなく、コンテキスト長の制限を克服する。
我々は、標準データベースと大規模科学表の両方の実験を通じて、我々のフレームワークを検証し、広範囲なデータセットの処理と洗練されたデータ分析の実行の有効性を実証した。
関連論文リスト
- HI-SQL: Optimizing Text-to-SQL Systems through Dynamic Hint Integration [1.3927943269211591]
テキスト・ツー・ジェネレーションは自然言語とデータベースのギャップを埋め、ユーザーは専門知識を必要とせずにデータをクエリできる。
履歴クエリログを利用した新しいヒント生成機構を組み込んだパイプラインHI-theを提案する。
先行クエリを解析することにより、マルチテーブルおよびネストされた操作の複雑さを扱うことに焦点を当てたコンテキストヒントを生成する。
提案手法は,LCM生成クエリのクエリ精度を大幅に向上し,呼び出しやレイテンシの面で効率性を確保した。
論文 参考訳(メタデータ) (2025-06-11T12:07:55Z) - LLM-Symbolic Integration for Robust Temporal Tabular Reasoning [69.27153114778748]
本研究では,システムおよび制御された評価のための合成データセットであるTempTabQA-Cを紹介する。
この構造化アプローチにより、LLM(Large Language Models)はsqlクエリの生成と実行を可能にし、一般化とバイアス軽減の強化を行う。
論文 参考訳(メタデータ) (2025-06-06T05:14:04Z) - Bridging the Gap: Enabling Natural Language Queries for NoSQL Databases through Text-to-NoSQL Translation [25.638927795540454]
自然言語クエリをアクセス可能なクエリに変換することを目的としたText-to-Noタスクを導入する。
この分野での研究を促進するために、我々はTEND(Text-to-Noデータセットのショートインターフェース)という、このタスクのための大規模かつオープンソースのデータセットをリリースした。
また,SLM(Small Language Model)支援とRAG(Retrieval-augmented Generation)支援の多段階フレームワークSMARTを設計した。
論文 参考訳(メタデータ) (2025-02-16T17:01:48Z) - E-SQL: Direct Schema Linking via Question Enrichment in Text-to-SQL [1.187832944550453]
E-Seekは、直接スキーマリンクと候補述語拡張を通じてこれらの課題に対処するように設計された、新しいパイプラインである。
E-Seekは、関連するデータベース項目(テーブル、列、値)と条件を直接質問とsql構築計画に組み込むことで、自然言語クエリを強化し、クエリとデータベース構造の間のギャップを埋める。
総合的な評価は、E-Seekが競争性能、特に66.29%の実行精度で複雑なクエリに優れていることを示している。
論文 参考訳(メタデータ) (2024-09-25T09:02:48Z) - RB-SQL: A Retrieval-based LLM Framework for Text-to-SQL [48.516004807486745]
文脈内学習を伴う大規模言語モデル(LLM)は、テキスト・ツー・タスクの性能を大幅に改善した。
In-context prompt Engineering のための新しい検索ベースフレームワーク RB- を提案する。
実験により,我々のモデルは,公開データセットのBIRDとSpiderの競合ベースラインよりも優れた性能が得られることが示された。
論文 参考訳(メタデータ) (2024-07-11T08:19:58Z) - UQE: A Query Engine for Unstructured Databases [71.49289088592842]
構造化されていないデータ分析を可能にするために,大規模言語モデルの可能性を検討する。
本稿では,非構造化データ収集からの洞察を直接問合せ,抽出するUniversal Query Engine (UQE)を提案する。
論文 参考訳(メタデータ) (2024-06-23T06:58:55Z) - SQL-PaLM: Improved Large Language Model Adaptation for Text-to-SQL (extended) [53.95151604061761]
本稿では,大規模言語モデル(LLM)を用いたテキスト・ツー・フィルタリングのフレームワークを提案する。
数発のプロンプトで、実行ベースのエラー解析による一貫性復号化の有効性について検討する。
命令の微調整により、チューニングされたLLMの性能に影響を及ぼす重要なパラダイムの理解を深める。
論文 参考訳(メタデータ) (2023-05-26T21:39:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。