論文の概要: Text2VectorSQL: Bridging Text-to-SQL and Vector Search for Unified Natural Language Queries
- arxiv url: http://arxiv.org/abs/2506.23071v1
- Date: Sun, 29 Jun 2025 03:17:42 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-01 21:27:53.702238
- Title: Text2VectorSQL: Bridging Text-to-SQL and Vector Search for Unified Natural Language Queries
- Title(参考訳): Text2VectorSQL: 統一自然言語クエリのためのテキストからSQLへのブリッジとベクトル検索
- Authors: Zhengren Wang, Bozhou Li, Dongwen Yao, Wentao Zhang,
- Abstract要約: Text2 - Text-to-とベクトル検索を統合する新しいフレームワークを紹介する。
Text2はセマンティックフィルタリング、マルチモーダルマッチング、検索アクセラレーションを可能にする。
合成データを用いた専用Text2モデルを開発し,ベースライン法よりも優れた性能を示す。
- 参考スコア(独自算出の注目度): 19.61835087779078
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: While Text-to-SQL enables natural language interaction with structured databases, its effectiveness diminishes with unstructured data or ambiguous queries due to rigid syntax and limited expressiveness. Concurrently, vector search has emerged as a powerful paradigm for semantic retrieval, particularly for unstructured data. However, existing VectorSQL implementations still rely heavily on manual crafting and lack tailored evaluation frameworks, leaving a significant gap between theoretical potential and practical deployment. To bridge these complementary paradigms, we introduces Text2VectorSQL, a novel framework unifying Text-to-SQL and vector search to overcome expressiveness constraints and support more diverse and holistical natural language queries. Specifically, Text2VectorSQL enables semantic filtering, multi-modal matching, and retrieval acceleration. For evaluation, we build vector index on appropriate columns, extend user queries with semantic search, and annotate ground truths via an automatic pipeline with expert review. Furthermore, we develop dedicated Text2VectorSQL models with synthetic data, demonstrating significant performance improvements over baseline methods. Our work establishes the foundation for the Text2VectorSQL task, paving the way for more versatile and intuitive database interfaces. The repository will be publicly available at https://github.com/Open-DataFlow/Text2VectorSQL.
- Abstract(参考訳): Text-to-SQLは構造化データベースとの自然言語インタラクションを可能にするが、その有効性は、厳密な構文と限定された表現性のために、構造化されていないデータやあいまいなクエリによって低下する。
同時に、ベクトル探索は意味検索、特に非構造化データのための強力なパラダイムとして登場した。
しかしながら、既存のVectorSQLの実装は手作業による開発に大きく依存しており、適切な評価フレームワークが欠如しているため、理論的な可能性と実践的なデプロイメントの間には大きなギャップが残されている。
これらの相補的なパラダイムをブリッジするために,Text2VectorSQLを紹介した。Text-to-SQLとベクター検索を統合し,表現性の制約を克服し,より多様でホリスティックな自然言語クエリをサポートする。
具体的には、Text2VectorSQLはセマンティックフィルタリング、マルチモーダルマッチング、検索アクセラレーションを可能にする。
評価のために,適切な列上にベクトルインデックスを構築し,セマンティック検索によるユーザクエリを拡張し,専門家レビューによる自動パイプラインによる注釈付けを行う。
さらに,合成データを用いた専用Text2VectorSQLモデルを開発し,ベースライン法よりも優れた性能を示す。
私たちの研究はText2VectorSQLタスクの基盤を確立し、より汎用的で直感的なデータベースインターフェースへの道を開いた。
リポジトリはhttps://github.com/Open-DataFlow/Text2VectorSQLで公開されている。
関連論文リスト
- Datrics Text2SQL: A Framework for Natural Language to SQL Query Generation [0.0]
本稿では,構造化ドキュメンテーション,サンプルベース学習,ドメイン固有のルールを活用することで,正確なsqlクエリを生成するためのRAG(Retrieval-Augmented Generation)ベースのフレームワークを提案する。
アーキテクチャ、トレーニング方法論、検索ロジックについて詳述し、システムがどのようにユーザ意図とデータベース構造の間のギャップを、専門知識を必要とせずに埋めるかを強調した。
論文 参考訳(メタデータ) (2025-04-03T21:09:59Z) - Bridging the Gap: Enabling Natural Language Queries for NoSQL Databases through Text-to-NoSQL Translation [25.638927795540454]
自然言語クエリをアクセス可能なクエリに変換することを目的としたText-to-Noタスクを導入する。
この分野での研究を促進するために、我々はTEND(Text-to-Noデータセットのショートインターフェース)という、このタスクのための大規模かつオープンソースのデータセットをリリースした。
また,SLM(Small Language Model)支援とRAG(Retrieval-augmented Generation)支援の多段階フレームワークSMARTを設計した。
論文 参考訳(メタデータ) (2025-02-16T17:01:48Z) - E-SQL: Direct Schema Linking via Question Enrichment in Text-to-SQL [1.187832944550453]
E-Seekは、直接スキーマリンクと候補述語拡張を通じてこれらの課題に対処するように設計された、新しいパイプラインである。
E-Seekは、関連するデータベース項目(テーブル、列、値)と条件を直接質問とsql構築計画に組み込むことで、自然言語クエリを強化し、クエリとデータベース構造の間のギャップを埋める。
総合的な評価は、E-Seekが競争性能、特に66.29%の実行精度で複雑なクエリに優れていることを示している。
論文 参考訳(メタデータ) (2024-09-25T09:02:48Z) - SQLformer: Deep Auto-Regressive Query Graph Generation for Text-to-SQL Translation [16.07396492960869]
本稿では,テキストからテキストへの変換処理に特化して設計されたトランスフォーマーアーキテクチャを提案する。
我々のモデルは、実行可能層とデコーダ層に構造的帰納バイアスを組み込んで、クエリを自動で抽象構文木(AST)として予測する。
論文 参考訳(メタデータ) (2023-10-27T00:13:59Z) - SQL-PaLM: Improved Large Language Model Adaptation for Text-to-SQL (extended) [53.95151604061761]
本稿では,大規模言語モデル(LLM)を用いたテキスト・ツー・フィルタリングのフレームワークを提案する。
数発のプロンプトで、実行ベースのエラー解析による一貫性復号化の有効性について検討する。
命令の微調整により、チューニングされたLLMの性能に影響を及ぼす重要なパラダイムの理解を深める。
論文 参考訳(メタデータ) (2023-05-26T21:39:05Z) - UNITE: A Unified Benchmark for Text-to-SQL Evaluation [72.72040379293718]
テキスト・ツー・ドメイン・システムのためのUNIfiedベンチマークを導入する。
公開されているテキストからドメインへのデータセットと29Kデータベースで構成されている。
広く使われているSpiderベンチマークと比較すると、SQLパターンの3倍の増加が紹介されている。
論文 参考訳(メタデータ) (2023-05-25T17:19:52Z) - Towards Generalizable and Robust Text-to-SQL Parsing [77.18724939989647]
本稿では,タスク分解,知識獲得,知識構成からなる新しいTKKフレームワークを提案する。
このフレームワークは,Spider,SParC,Co.データセット上でのすべてのシナリオと最先端のパフォーマンスに有効であることを示す。
論文 参考訳(メタデータ) (2022-10-23T09:21:27Z) - A Survey on Text-to-SQL Parsing: Concepts, Methods, and Future
Directions [102.8606542189429]
テキストからコーパスへのパースの目的は、自然言語(NL)質問をデータベースが提供するエビデンスに基づいて、対応する構造化クエリ言語()に変換することである。
ディープニューラルネットワークは、入力NL質問から出力クエリへのマッピング関数を自動的に学習するニューラルジェネレーションモデルによって、このタスクを大幅に進歩させた。
論文 参考訳(メタデータ) (2022-08-29T14:24:13Z) - "What Do You Mean by That?" A Parser-Independent Interactive Approach
for Enhancing Text-to-SQL [49.85635994436742]
ループ内に人間を包含し,複数質問を用いてユーザと対話する,新規非依存型対話型アプローチ(PIIA)を提案する。
PIIAは、シミュレーションと人的評価の両方を用いて、限られたインタラクションターンでテキストとドメインのパフォーマンスを向上させることができる。
論文 参考訳(メタデータ) (2020-11-09T02:14:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。