論文の概要: The Death of Schema Linking? Text-to-SQL in the Age of Well-Reasoned Language Models
- arxiv url: http://arxiv.org/abs/2408.07702v1
- Date: Wed, 14 Aug 2024 17:59:04 GMT
- ステータス: 処理完了
- システム内更新日: 2024-08-15 12:33:27.410623
- Title: The Death of Schema Linking? Text-to-SQL in the Age of Well-Reasoned Language Models
- Title(参考訳): スキーマリンクの死 : 調和した言語モデルの時代におけるテキストからSQL
- Authors: Karime Maamari, Fadhil Abubaker, Daniel Jaroslawicz, Amine Mhedhbi,
- Abstract要約: より新しいモデルは、明示的なスキーマリンクを必要とせずに、生成中の関連するスキーマ要素を識別できる。
これにより、Text-to-パイプラインはスキーマのリンクを完全にバイパスし、完全なデータベースをLLMに渡すことで、必要な情報を除外するリスクを排除できる。
提案手法はBIRDベンチマークで71.83%の実行精度を達成し,提出時にランキング1位となった。
- 参考スコア(独自算出の注目度): 0.9149661171430259
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Schema linking is a crucial step in Text-to-SQL pipelines, which translate natural language queries into SQL. The goal of schema linking is to retrieve relevant tables and columns (signal) while disregarding irrelevant ones (noise). However, imperfect schema linking can often exclude essential columns needed for accurate query generation. In this work, we revisit the need for schema linking when using the latest generation of large language models (LLMs). We find empirically that newer models are adept at identifying relevant schema elements during generation, without the need for explicit schema linking. This allows Text-to-SQL pipelines to bypass schema linking entirely and instead pass the full database schema to the LLM, eliminating the risk of excluding necessary information. Furthermore, as alternatives to schema linking, we propose techniques that improve Text-to-SQL accuracy without compromising on essential schema information. Our approach achieves 71.83\% execution accuracy on the BIRD benchmark, ranking first at the time of submission.
- Abstract(参考訳): スキーマリンクは、自然言語クエリをSQLに変換するText-to-SQLパイプラインにおいて、重要なステップである。
スキーマリンクの目標は、関連するテーブルや列(シグナル)を検索し、無関係なもの(ノイズ)を無視することである。
しかしながら、不完全なスキーマリンクは、正確なクエリ生成に必要な必須列を除外することが多い。
本研究では,次世代の大規模言語モデル(LLM)を使用する場合,スキーマリンクの必要性を再考する。
より新しいモデルは、明示的なスキーマリンクを必要とせずに、生成中に関連するスキーマ要素を識別できる。
これにより、Text-to-SQLパイプラインはスキーマのリンクを完全にバイパスし、完全なデータベーススキーマをLLMに渡すことで、必要な情報を除外するリスクを排除できる。
さらに,スキーマリンクの代替として,本質的なスキーマ情報に係わることなく,テキストからSQLまでの精度を向上させる手法を提案する。
提案手法は,BIRDベンチマークで71.83\%の実行精度を達成し,提出時に最初にランク付けする。
関連論文リスト
- RSL-SQL: Robust Schema Linking in Text-to-SQL Generation [51.00761167842468]
本稿では、双方向スキーマリンク、コンテキスト情報拡張、バイナリ選択戦略、マルチターン自己補正を組み合わせたRSLと呼ばれる新しいフレームワークを提案する。
ベンチマークの結果,オープンソースのソリューション間でのSOTA実行精度は67.2%,BIRDは87.9%,GPT-4オクルージョンは87.9%であった。
提案手法は,DeepSeekを同一のプロンプトで適用した場合,GPT-4ベースのテキスト・ツー・シークシステムよりも優れている。
論文 参考訳(メタデータ) (2024-10-31T16:22:26Z) - SQL-to-Schema Enhances Schema Linking in Text-to-SQL [15.6857201570992]
テキストから音声へのメソッドでは、不要なテーブルや列をフィルタリングする必要がある。
これまでのアプローチでは、テーブルや列のソートが問題との関連性に基づいて行われてきた。
提案手法は,2段階に分けて提案するスキーマリンク方式である。
論文 参考訳(メタデータ) (2024-05-15T12:22:48Z) - Schema-Aware Multi-Task Learning for Complex Text-to-SQL [4.913409359995421]
複雑なsqlクエリのためのスキーマ対応マルチタスク学習フレームワーク(MT)を提案する。
具体的には、有効な質問スキーマリンクを識別するために、識別器モジュールを設計する。
デコーダ側では、テーブルと列の接続を記述するために、6種類の関係を定義します。
論文 参考訳(メタデータ) (2024-03-09T01:13:37Z) - CRUSH4SQL: Collective Retrieval Using Schema Hallucination For Text2SQL [47.14954737590405]
既存のテキストからテキストへのジェネレータでは、スキーマ全体をユーザテキストでエンコードする必要がある。
大規模な構造化データベースをサブセット化するのに、標準的な高密度検索技術は不十分である。
大規模データベース上でスキーマサブセットを作成するためのベンチマークを3つ導入する。
論文 参考訳(メタデータ) (2023-11-02T12:13:52Z) - Improving Text-to-SQL Semantic Parsing with Fine-grained Query
Understanding [84.04706075621013]
トークンレベルのきめ細かいクエリ理解に基づく汎用的モジュール型ニューラルネットワーク解析フレームワークを提案する。
我々のフレームワークは、名前付きエンティティ認識(NER)、ニューラルエンティティリンカ(NEL)、ニューラルエンティティリンカ(NSP)の3つのモジュールから構成されている。
論文 参考訳(メタデータ) (2022-09-28T21:00:30Z) - Semantic Enhanced Text-to-SQL Parsing via Iteratively Learning Schema
Linking Graph [6.13728903057727]
新しいデータベースへの一般化性は、人間の発話を insql 文を解析することを目的とした Text-to- システムにとって極めて重要である。
本稿では,質問トークンとデータベーススキーマ間のセマンティックなスキーマリンクグラフを反復的に構築するIS ESLというフレームワークを提案する。
3つのベンチマークでの大規模な実験により、IS ESLはベースラインを一貫して上回り、さらなる調査ではその一般化可能性と堅牢性を示している。
論文 参考訳(メタデータ) (2022-08-08T03:59:33Z) - Proton: Probing Schema Linking Information from Pre-trained Language
Models for Text-to-SQL Parsing [66.55478402233399]
本稿では,ポアンカー距離測定に基づく探索手法を用いて,関係構造を抽出する枠組みを提案する。
スキーマリンクの一般的なルールベース手法と比較して,探索関係は意味的対応をしっかりと捉えることができることがわかった。
我々のフレームワークは3つのベンチマークで最先端のパフォーマンスを新たに設定する。
論文 参考訳(メタデータ) (2022-06-28T14:05:25Z) - ShadowGNN: Graph Projection Neural Network for Text-to-SQL Parser [36.12921337235763]
抽象レベルとセマンティックレベルでスキーマを処理する新しいアーキテクチャであるShadowGNNを提案します。
チャレンジングなText-to-Spiderベンチマークでは、経験的な結果がShadowGNNが最先端のモデルを上回ることを示しています。
論文 参考訳(メタデータ) (2021-04-10T05:48:28Z) - Bridging Textual and Tabular Data for Cross-Domain Text-to-SQL Semantic
Parsing [110.97778888305506]
BRIDGEは、フィールドのサブセットが質問に言及されたセル値で拡張されるタグ付きシーケンスの質問とDBスキーマを表します。
BRIDGEは、人気のクロスDBテキスト-リレーショナルベンチマークで最先端のパフォーマンスを達成しました。
本分析は,BRIDGEが望まれる相互依存を効果的に捕捉し,さらにテキストDB関連タスクに一般化する可能性を示唆している。
論文 参考訳(メタデータ) (2020-12-23T12:33:52Z) - IGSQL: Database Schema Interaction Graph Based Neural Model for
Context-Dependent Text-to-SQL Generation [61.09660709356527]
本稿では,データベーススキーマインタラクショングラフエンコーダを提案し,データベーススキーマ項目の履歴情報を利用する。
ベンチマークSParCおよびCoデータセットを用いて,本モデルの評価を行った。
論文 参考訳(メタデータ) (2020-11-11T12:56:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。