論文の概要: SeqGenSQL -- A Robust Sequence Generation Model for Structured Query
Language
- arxiv url: http://arxiv.org/abs/2011.03836v1
- Date: Sat, 7 Nov 2020 19:22:59 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-28 22:34:14.909544
- Title: SeqGenSQL -- A Robust Sequence Generation Model for Structured Query
Language
- Title(参考訳): SeqGenSQL - 構造化クエリ言語のためのロバストシーケンス生成モデル
- Authors: Ning Li, Bethany Keller, Mark Butler, Daniel Cer
- Abstract要約: データベースに格納された情報にインターフェースする汎用自然言語は、自然言語の質問をデータベースクエリに柔軟に翻訳する必要がある。
最適なテキスト・ジェネレータシステムは、まず質問を中間論理形式(LF)に変換することでこの問題にアプローチする(Lyu et al. (2020))
本稿では,T5(Raffel et al.)を用いた質問 tosql 文の直接変換にアプローチする。
先行技術(Min et al.)に対して性能改善は6.6%絶対であり、状態性能にアプローチする。
- 参考スコア(独自算出の注目度): 5.0873556718569155
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We explore using T5 (Raffel et al. (2019)) to directly translate natural
language questions into SQL statements. General purpose natural language that
interfaces to information stored within databases requires flexibly translating
natural language questions into database queries. The best performing
text-to-SQL systems approach this task by first converting questions into an
intermediate logical form (LF) (Lyu et al. (2020)). While LFs provide a
convenient intermediate representation and simplify query generation, they
introduce an additional layer of complexity and annotation requirements.
However, weakly supervised modeling that directly converts questions to SQL
statements has proven more difficult without the scaffolding provided by LFs
(Min et al. (2019)). We approach direct conversion of questions to SQL
statements using T5 (Raffel et al. (2019)), a pre-trained textto-text
generation model, modified to support pointer-generator style decoding (See et
al. (2017)). We explore using question augmentation with table schema
information and the use of automatically generated silver training data. The
resulting model achieves 90.5% execution accuracy on the WikiSQL (Zhong et al.
(2017)) test data set, a new state-of-the-art on weakly supervised SQL
generation. The performance improvement is 6.6% absolute over the prior
state-of-the-art (Min et al. (2019)) and approaches the performance of
state-ofthe-art systems making use of LFs.
- Abstract(参考訳): 我々は、自然言語の質問をsql文に直接翻訳するために、t5(raffel et al. (2019))を使用します。
データベースに格納された情報にインターフェースする汎用自然言語は、自然言語の質問をデータベースクエリに柔軟に翻訳する必要がある。
最高のテキスト対SQLシステムは、まず質問を中間論理形式(LF)に変換することでこの問題にアプローチする(Lyu et al. (2020))。
LFは便利な中間表現を提供し、クエリ生成を単純化する一方で、複雑さとアノテーションのさらなるレイヤを導入している。
しかし、質問を直接SQLステートメントに変換する弱い教師付きモデリングは、LF(Min et al. (2019))が提供する足場なしではより困難であることが判明した。
プリトレーニングされたテキストからテキストへの生成モデルであるt5 (raffel et al. (2019)) を使って、質問をsql文に直接変換し、ポインタ生成子形式のデコードをサポートするように修正する( et al. (2017) を参照)。
テーブルスキーマ情報を用いた質問拡張と,自動生成したシルバートレーニングデータの利用について検討する。
結果として得られたモデルはWikiSQL(Zhong et al. (2017))テストデータセット上で90.5%の実行精度を達成する。
性能改善は従来の最先端システム(Min et al. (2019))に対して6.6%絶対であり、LFを用いた最先端システムの性能にアプローチする。
関連論文リスト
- RSL-SQL: Robust Schema Linking in Text-to-SQL Generation [51.00761167842468]
本稿では、双方向スキーマリンク、コンテキスト情報拡張、バイナリ選択戦略、マルチターン自己補正を組み合わせたRSLと呼ばれる新しいフレームワークを提案する。
ベンチマークの結果,オープンソースのソリューション間でのSOTA実行精度は67.2%,BIRDは87.9%,GPT-4オクルージョンは87.9%であった。
提案手法は,DeepSeekを同一のプロンプトで適用した場合,GPT-4ベースのテキスト・ツー・シークシステムよりも優れている。
論文 参考訳(メタデータ) (2024-10-31T16:22:26Z) - SelECT-SQL: Self-correcting ensemble Chain-of-Thought for Text-to-SQL [3.422309388045878]
SelECT-は、チェーン・オブ・シンク、自己補正、アンサンブルの手法をアルゴリズムで組み合わせた、新しいインコンテキスト学習ソリューションである。
具体的には、GPTをベースLLMとして使用する場合、SelECT-Turboはスパイダーリーダーボードの開発セット上で84.2%の実行精度を達成する。
論文 参考訳(メタデータ) (2024-09-16T05:40:18Z) - SQLformer: Deep Auto-Regressive Query Graph Generation for Text-to-SQL Translation [16.07396492960869]
本稿では,テキストからテキストへの変換処理に特化して設計されたトランスフォーマーアーキテクチャを提案する。
我々のモデルは、実行可能層とデコーダ層に構造的帰納バイアスを組み込んで、クエリを自動で抽象構文木(AST)として予測する。
論文 参考訳(メタデータ) (2023-10-27T00:13:59Z) - UNITE: A Unified Benchmark for Text-to-SQL Evaluation [72.72040379293718]
テキスト・ツー・ドメイン・システムのためのUNIfiedベンチマークを導入する。
公開されているテキストからドメインへのデータセットと29Kデータベースで構成されている。
広く使われているSpiderベンチマークと比較すると、SQLパターンの3倍の増加が紹介されている。
論文 参考訳(メタデータ) (2023-05-25T17:19:52Z) - Graphix-T5: Mixing Pre-Trained Transformers with Graph-Aware Layers for
Text-to-SQL Parsing [56.232873134174056]
テキストからテキストへのパースにおける大きな課題の1つはドメインの一般化である。
そこで本研究では,テキスト・トゥ・テキスト・パーシングのための特殊なコンポーネントを備えた事前学習されたテキスト・ツー・テキスト・トランスフォーマー・モデルをさらに強化する方法について検討する。
この目的のために,レイヤを持つグラフ認識モデルによって拡張された新しいアーキテクチャ GRAPHIX-T5 を提案する。
論文 参考訳(メタデータ) (2023-01-18T13:29:05Z) - A Survey on Text-to-SQL Parsing: Concepts, Methods, and Future
Directions [102.8606542189429]
テキストからコーパスへのパースの目的は、自然言語(NL)質問をデータベースが提供するエビデンスに基づいて、対応する構造化クエリ言語()に変換することである。
ディープニューラルネットワークは、入力NL質問から出力クエリへのマッピング関数を自動的に学習するニューラルジェネレーションモデルによって、このタスクを大幅に進歩させた。
論文 参考訳(メタデータ) (2022-08-29T14:24:13Z) - Weakly Supervised Text-to-SQL Parsing through Question Decomposition [53.22128541030441]
我々は最近提案されたQDMR(QDMR)という意味表現を活用している。
質問やQDMR構造(非専門家によって注釈付けされたり、自動予測されたりする)、回答が与えられたら、我々は自動的にsqlクエリを合成できる。
本結果は,NL-ベンチマークデータを用いて訓練したモデルと,弱い教師付きモデルが競合することを示す。
論文 参考訳(メタデータ) (2021-12-12T20:02:42Z) - Dual Reader-Parser on Hybrid Textual and Tabular Evidence for Open
Domain Question Answering [78.9863753810787]
世界の知識は構造化データベースに保存されている。
クエリ言語は、複雑な推論を必要とする質問に答えるだけでなく、完全な説明可能性を提供することができる。
論文 参考訳(メタデータ) (2021-08-05T22:04:13Z) - Data Augmentation with Hierarchical SQL-to-Question Generation for
Cross-domain Text-to-SQL Parsing [40.65143087243074]
本稿では,単純なデータ拡張フレームワークを提案する。
まず、データベースを与えられたら、抽象構文木文法citeyintranxに基づいて大量のsqlクエリを自動的に生成します。
第2に,高品質自然言語問題を得るための階層的sql-to-question生成モデルを提案する。
論文 参考訳(メタデータ) (2021-03-03T07:37:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。