Fugu-MT 論文翻訳(概要): SeqGenSQL -- A Robust Sequence Generation Model for Structured Query Language

論文の概要: SeqGenSQL -- A Robust Sequence Generation Model for Structured Query Language

arxiv url: http://arxiv.org/abs/2011.03836v1
Date: Sat, 7 Nov 2020 19:22:59 GMT
ステータス: 翻訳完了
システム内更新日: 2022-09-28 22:34:14.909544
Title: SeqGenSQL -- A Robust Sequence Generation Model for Structured Query Language
Title（参考訳）: SeqGenSQL - 構造化クエリ言語のためのロバストシーケンス生成モデル
Authors: Ning Li, Bethany Keller, Mark Butler, Daniel Cer
Abstract要約: データベースに格納された情報にインターフェースする汎用自然言語は、自然言語の質問をデータベースクエリに柔軟に翻訳する必要がある。最適なテキスト・ジェネレータシステムは、まず質問を中間論理形式(LF)に変換することでこの問題にアプローチする(Lyu et al. (2020)) 本稿では,T5(Raffel et al.)を用いた質問 tosql 文の直接変換にアプローチする。先行技術(Min et al.)に対して性能改善は6.6%絶対であり、状態性能にアプローチする。
参考スコア（独自算出の注目度）: 5.0873556718569155
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: We explore using T5 (Raffel et al. (2019)) to directly translate natural language questions into SQL statements. General purpose natural language that interfaces to information stored within databases requires flexibly translating natural language questions into database queries. The best performing text-to-SQL systems approach this task by first converting questions into an intermediate logical form (LF) (Lyu et al. (2020)). While LFs provide a convenient intermediate representation and simplify query generation, they introduce an additional layer of complexity and annotation requirements. However, weakly supervised modeling that directly converts questions to SQL statements has proven more difficult without the scaffolding provided by LFs (Min et al. (2019)). We approach direct conversion of questions to SQL statements using T5 (Raffel et al. (2019)), a pre-trained textto-text generation model, modified to support pointer-generator style decoding (See et al. (2017)). We explore using question augmentation with table schema information and the use of automatically generated silver training data. The resulting model achieves 90.5% execution accuracy on the WikiSQL (Zhong et al. (2017)) test data set, a new state-of-the-art on weakly supervised SQL generation. The performance improvement is 6.6% absolute over the prior state-of-the-art (Min et al. (2019)) and approaches the performance of state-ofthe-art systems making use of LFs.
Abstract（参考訳）: 我々は、自然言語の質問をsql文に直接翻訳するために、t5(raffel et al. (2019))を使用します。データベースに格納された情報にインターフェースする汎用自然言語は、自然言語の質問をデータベースクエリに柔軟に翻訳する必要がある。最高のテキスト対SQLシステムは、まず質問を中間論理形式(LF)に変換することでこの問題にアプローチする(Lyu et al. (2020))。 LFは便利な中間表現を提供し、クエリ生成を単純化する一方で、複雑さとアノテーションのさらなるレイヤを導入している。しかし、質問を直接SQLステートメントに変換する弱い教師付きモデリングは、LF(Min et al. (2019))が提供する足場なしではより困難であることが判明した。プリトレーニングされたテキストからテキストへの生成モデルであるt5 (raffel et al. (2019)) を使って、質問をsql文に直接変換し、ポインタ生成子形式のデコードをサポートするように修正する( et al. (2017) を参照)。テーブルスキーマ情報を用いた質問拡張と,自動生成したシルバートレーニングデータの利用について検討する。結果として得られたモデルはWikiSQL(Zhong et al. (2017))テストデータセット上で90.5%の実行精度を達成する。性能改善は従来の最先端システム(Min et al. (2019))に対して6.6%絶対であり、LFを用いた最先端システムの性能にアプローチする。

関連論文リスト

LLMSQL: Upgrading WikiSQL for the LLM Era of Text-to-SQL [0.2799896314754614]
本稿では,Wiki の体系的な改訂と変換である LLM について述べる。これらのエラーを分類し、クリーニングと再アノテーションのための自動メソッドを実装します。 LLMはアップデートとして機能するのではなく、LLM対応のベンチマークとして導入された。
論文参考訳（メタデータ） (2025-09-27T15:08:43Z)
SLM-SQL: An Exploration of Small Language Models for Text-to-SQL [0.0]
小型言語モデル(SLM)は、エッジデプロイメントに適した推論速度と適合性に固有のアドバンテージを提供する。ポストトレーニング技術の最近の進歩を活用して、Textto- Applicationsを探索する。実験により,本手法の有効性と一般化性について検証した。
論文参考訳（メタデータ） (2025-07-30T08:29:07Z)
EzSQL: An SQL intermediate representation for improving SQL-to-text Generation [1.6385815610837167]
我々は、自然言語のテキストシーケンスと整合するEzと呼ばれる新しいモデルを開発した。 Ezは演算子とキーワードを変更することで、クエリを自然言語テキストに近づける。ウィキやスパイダーのデータセットのクエリからテキスト記述を生成する手法として,本モデルが有効であることを示す。
論文参考訳（メタデータ） (2024-11-28T05:24:46Z)
RSL-SQL: Robust Schema Linking in Text-to-SQL Generation [51.00761167842468]
本稿では、双方向スキーマリンク、コンテキスト情報拡張、バイナリ選択戦略、マルチターン自己補正を組み合わせたRSLと呼ばれる新しいフレームワークを提案する。ベンチマークの結果,オープンソースのソリューション間でのSOTA実行精度は67.2%,BIRDは87.9%,GPT-4オクルージョンは87.9%であった。提案手法は,DeepSeekを同一のプロンプトで適用した場合,GPT-4ベースのテキスト・ツー・シークシステムよりも優れている。
論文参考訳（メタデータ） (2024-10-31T16:22:26Z)
SelECT-SQL: Self-correcting ensemble Chain-of-Thought for Text-to-SQL [3.422309388045878]
SelECT-は、チェーン・オブ・シンク、自己補正、アンサンブルの手法をアルゴリズムで組み合わせた、新しいインコンテキスト学習ソリューションである。具体的には、GPTをベースLLMとして使用する場合、SelECT-Turboはスパイダーリーダーボードの開発セット上で84.2%の実行精度を達成する。
論文参考訳（メタデータ） (2024-09-16T05:40:18Z)
SQLformer: Deep Auto-Regressive Query Graph Generation for Text-to-SQL Translation [16.07396492960869]
本稿では,テキストからテキストへの変換処理に特化して設計されたトランスフォーマーアーキテクチャを提案する。我々のモデルは、実行可能層とデコーダ層に構造的帰納バイアスを組み込んで、クエリを自動で抽象構文木(AST)として予測する。
論文参考訳（メタデータ） (2023-10-27T00:13:59Z)
UNITE: A Unified Benchmark for Text-to-SQL Evaluation [72.72040379293718]
テキスト・ツー・ドメイン・システムのためのUNIfiedベンチマークを導入する。公開されているテキストからドメインへのデータセットと29Kデータベースで構成されている。広く使われているSpiderベンチマークと比較すると、SQLパターンの3倍の増加が紹介されている。
論文参考訳（メタデータ） (2023-05-25T17:19:52Z)
Graphix-T5: Mixing Pre-Trained Transformers with Graph-Aware Layers for Text-to-SQL Parsing [56.232873134174056]
テキストからテキストへのパースにおける大きな課題の1つはドメインの一般化である。そこで本研究では,テキスト・トゥ・テキスト・パーシングのための特殊なコンポーネントを備えた事前学習されたテキスト・ツー・テキスト・トランスフォーマー・モデルをさらに強化する方法について検討する。この目的のために,レイヤを持つグラフ認識モデルによって拡張された新しいアーキテクチャ GRAPHIX-T5 を提案する。
論文参考訳（メタデータ） (2023-01-18T13:29:05Z)
A Survey on Text-to-SQL Parsing: Concepts, Methods, and Future Directions [102.8606542189429]
テキストからコーパスへのパースの目的は、自然言語(NL)質問をデータベースが提供するエビデンスに基づいて、対応する構造化クエリ言語()に変換することである。ディープニューラルネットワークは、入力NL質問から出力クエリへのマッピング関数を自動的に学習するニューラルジェネレーションモデルによって、このタスクを大幅に進歩させた。
論文参考訳（メタデータ） (2022-08-29T14:24:13Z)
Weakly Supervised Text-to-SQL Parsing through Question Decomposition [53.22128541030441]
我々は最近提案されたQDMR(QDMR)という意味表現を活用している。質問やQDMR構造(非専門家によって注釈付けされたり、自動予測されたりする)、回答が与えられたら、我々は自動的にsqlクエリを合成できる。本結果は,NL-ベンチマークデータを用いて訓練したモデルと,弱い教師付きモデルが競合することを示す。
論文参考訳（メタデータ） (2021-12-12T20:02:42Z)
Dual Reader-Parser on Hybrid Textual and Tabular Evidence for Open Domain Question Answering [78.9863753810787]
世界の知識は構造化データベースに保存されている。クエリ言語は、複雑な推論を必要とする質問に答えるだけでなく、完全な説明可能性を提供することができる。
論文参考訳（メタデータ） (2021-08-05T22:04:13Z)
Data Augmentation with Hierarchical SQL-to-Question Generation for Cross-domain Text-to-SQL Parsing [40.65143087243074]
本稿では,単純なデータ拡張フレームワークを提案する。まず、データベースを与えられたら、抽象構文木文法citeyintranxに基づいて大量のsqlクエリを自動的に生成します。第2に,高品質自然言語問題を得るための階層的sql-to-question生成モデルを提案する。
論文参考訳（メタデータ） (2021-03-03T07:37:38Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。