論文の概要: SeqGenSQL -- A Robust Sequence Generation Model for Structured Query
Language
- arxiv url: http://arxiv.org/abs/2011.03836v1
- Date: Sat, 7 Nov 2020 19:22:59 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-28 22:34:14.909544
- Title: SeqGenSQL -- A Robust Sequence Generation Model for Structured Query
Language
- Title(参考訳): SeqGenSQL - 構造化クエリ言語のためのロバストシーケンス生成モデル
- Authors: Ning Li, Bethany Keller, Mark Butler, Daniel Cer
- Abstract要約: データベースに格納された情報にインターフェースする汎用自然言語は、自然言語の質問をデータベースクエリに柔軟に翻訳する必要がある。
最適なテキスト・ジェネレータシステムは、まず質問を中間論理形式(LF)に変換することでこの問題にアプローチする(Lyu et al. (2020))
本稿では,T5(Raffel et al.)を用いた質問 tosql 文の直接変換にアプローチする。
先行技術(Min et al.)に対して性能改善は6.6%絶対であり、状態性能にアプローチする。
- 参考スコア(独自算出の注目度): 5.0873556718569155
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We explore using T5 (Raffel et al. (2019)) to directly translate natural
language questions into SQL statements. General purpose natural language that
interfaces to information stored within databases requires flexibly translating
natural language questions into database queries. The best performing
text-to-SQL systems approach this task by first converting questions into an
intermediate logical form (LF) (Lyu et al. (2020)). While LFs provide a
convenient intermediate representation and simplify query generation, they
introduce an additional layer of complexity and annotation requirements.
However, weakly supervised modeling that directly converts questions to SQL
statements has proven more difficult without the scaffolding provided by LFs
(Min et al. (2019)). We approach direct conversion of questions to SQL
statements using T5 (Raffel et al. (2019)), a pre-trained textto-text
generation model, modified to support pointer-generator style decoding (See et
al. (2017)). We explore using question augmentation with table schema
information and the use of automatically generated silver training data. The
resulting model achieves 90.5% execution accuracy on the WikiSQL (Zhong et al.
(2017)) test data set, a new state-of-the-art on weakly supervised SQL
generation. The performance improvement is 6.6% absolute over the prior
state-of-the-art (Min et al. (2019)) and approaches the performance of
state-ofthe-art systems making use of LFs.
- Abstract(参考訳): 我々は、自然言語の質問をsql文に直接翻訳するために、t5(raffel et al. (2019))を使用します。
データベースに格納された情報にインターフェースする汎用自然言語は、自然言語の質問をデータベースクエリに柔軟に翻訳する必要がある。
最高のテキスト対SQLシステムは、まず質問を中間論理形式(LF)に変換することでこの問題にアプローチする(Lyu et al. (2020))。
LFは便利な中間表現を提供し、クエリ生成を単純化する一方で、複雑さとアノテーションのさらなるレイヤを導入している。
しかし、質問を直接SQLステートメントに変換する弱い教師付きモデリングは、LF(Min et al. (2019))が提供する足場なしではより困難であることが判明した。
プリトレーニングされたテキストからテキストへの生成モデルであるt5 (raffel et al. (2019)) を使って、質問をsql文に直接変換し、ポインタ生成子形式のデコードをサポートするように修正する( et al. (2017) を参照)。
テーブルスキーマ情報を用いた質問拡張と,自動生成したシルバートレーニングデータの利用について検討する。
結果として得られたモデルはWikiSQL(Zhong et al. (2017))テストデータセット上で90.5%の実行精度を達成する。
性能改善は従来の最先端システム(Min et al. (2019))に対して6.6%絶対であり、LFを用いた最先端システムの性能にアプローチする。
関連論文リスト
- SQLformer: Deep Auto-Regressive Query Graph Generation for Text-to-SQL
Translation [4.504050940874427]
本稿では,テキストから翻訳タスクを実行するためのトランスフォーマーアーキテクチャを提案する。
我々のモデルは、エンコーダ層とデコーダ層に構造バイアスを組み込んで、自動回帰的にクエリを抽象構文木(AST)として予測する。
私たちの実装はhttps://Adrian.com/BZG/former.comで公開されています。
論文 参考訳(メタデータ) (2023-10-27T00:13:59Z) - UNITE: A Unified Benchmark for Text-to-SQL Evaluation [72.72040379293718]
テキスト・ツー・ドメイン・システムのためのUNIfiedベンチマークを導入する。
公開されているテキストからドメインへのデータセットと29Kデータベースで構成されている。
広く使われているSpiderベンチマークと比較すると、SQLパターンの3倍の増加が紹介されている。
論文 参考訳(メタデータ) (2023-05-25T17:19:52Z) - QTSumm: Query-Focused Summarization over Tabular Data [58.62152746690958]
人々は主に、データ分析を行うか、特定の質問に答えるためにテーブルをコンサルティングします。
そこで本研究では,テキスト生成モデルに人間的な推論を行なわなければならない,クエリ中心のテーブル要約タスクを新たに定義する。
このタスクには,2,934テーブル上の7,111の人間注釈付きクエリ-サマリーペアを含む,QTSummという新しいベンチマークを導入する。
論文 参考訳(メタデータ) (2023-05-23T17:43:51Z) - Prompting GPT-3.5 for Text-to-SQL with De-semanticization and Skeleton
Retrieval [17.747079214502673]
Text-to-は、自然言語の質問を構造化されたクエリ言語()に変換し、データベースから情報を取得するタスクである。
本稿では,テキスト・トゥ・テキストのための LLM ベースのフレームワークを提案する。
我々は,疑問骨格を抽出する非意味化機構を設計し,その構造的類似性に基づいて類似した例を検索する。
論文 参考訳(メタデータ) (2023-04-26T06:02:01Z) - Graphix-T5: Mixing Pre-Trained Transformers with Graph-Aware Layers for
Text-to-SQL Parsing [56.232873134174056]
テキストからテキストへのパースにおける大きな課題の1つはドメインの一般化である。
そこで本研究では,テキスト・トゥ・テキスト・パーシングのための特殊なコンポーネントを備えた事前学習されたテキスト・ツー・テキスト・トランスフォーマー・モデルをさらに強化する方法について検討する。
この目的のために,レイヤを持つグラフ認識モデルによって拡張された新しいアーキテクチャ GRAPHIX-T5 を提案する。
論文 参考訳(メタデータ) (2023-01-18T13:29:05Z) - A Survey on Text-to-SQL Parsing: Concepts, Methods, and Future
Directions [102.8606542189429]
テキストからコーパスへのパースの目的は、自然言語(NL)質問をデータベースが提供するエビデンスに基づいて、対応する構造化クエリ言語()に変換することである。
ディープニューラルネットワークは、入力NL質問から出力クエリへのマッピング関数を自動的に学習するニューラルジェネレーションモデルによって、このタスクを大幅に進歩させた。
論文 参考訳(メタデータ) (2022-08-29T14:24:13Z) - Proton: Probing Schema Linking Information from Pre-trained Language
Models for Text-to-SQL Parsing [66.55478402233399]
本稿では,ポアンカー距離測定に基づく探索手法を用いて,関係構造を抽出する枠組みを提案する。
スキーマリンクの一般的なルールベース手法と比較して,探索関係は意味的対応をしっかりと捉えることができることがわかった。
我々のフレームワークは3つのベンチマークで最先端のパフォーマンスを新たに設定する。
論文 参考訳(メタデータ) (2022-06-28T14:05:25Z) - Dual Reader-Parser on Hybrid Textual and Tabular Evidence for Open
Domain Question Answering [78.9863753810787]
世界の知識は構造化データベースに保存されている。
クエリ言語は、複雑な推論を必要とする質問に答えるだけでなく、完全な説明可能性を提供することができる。
論文 参考訳(メタデータ) (2021-08-05T22:04:13Z) - Data Augmentation with Hierarchical SQL-to-Question Generation for
Cross-domain Text-to-SQL Parsing [40.65143087243074]
本稿では,単純なデータ拡張フレームワークを提案する。
まず、データベースを与えられたら、抽象構文木文法citeyintranxに基づいて大量のsqlクエリを自動的に生成します。
第2に,高品質自然言語問題を得るための階層的sql-to-question生成モデルを提案する。
論文 参考訳(メタデータ) (2021-03-03T07:37:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。