論文の概要: SADGA: Structure-Aware Dual Graph Aggregation Network for Text-to-SQL
- arxiv url: http://arxiv.org/abs/2111.00653v1
- Date: Mon, 1 Nov 2021 01:50:28 GMT
- ステータス: 処理完了
- システム内更新日: 2021-11-02 14:58:50.929011
- Title: SADGA: Structure-Aware Dual Graph Aggregation Network for Text-to-SQL
- Title(参考訳): SADGA: テキスト間SQLのための構造対応デュアルグラフ集約ネットワーク
- Authors: Ruichu Cai, Jinjie Yuan, Boyan Xu, Zhifeng Hao
- Abstract要約: Text-to-Graphの最も難しい問題の1つは、トレーニングされたモデルを見えないデータベーススキーマに一般化する方法である。
クロスドメインテキスト・トゥ・グラフのための構造対応デュアルグラフアグリゲーションネットワーク(SADGA)を提案する。
執筆時点では、挑戦的なText-to-GraphベンチマークのSpiderで3位を獲得しました。
- 参考スコア(独自算出の注目度): 29.328698264910596
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The Text-to-SQL task, aiming to translate the natural language of the
questions into SQL queries, has drawn much attention recently. One of the most
challenging problems of Text-to-SQL is how to generalize the trained model to
the unseen database schemas, also known as the cross-domain Text-to-SQL task.
The key lies in the generalizability of (i) the encoding method to model the
question and the database schema and (ii) the question-schema linking method to
learn the mapping between words in the question and tables/columns in the
database schema. Focusing on the above two key issues, we propose a
Structure-Aware Dual Graph Aggregation Network (SADGA) for cross-domain
Text-to-SQL. In SADGA, we adopt the graph structure to provide a unified
encoding model for both the natural language question and database schema.
Based on the proposed unified modeling, we further devise a structure-aware
aggregation method to learn the mapping between the question-graph and
schema-graph. The structure-aware aggregation method is featured with Global
Graph Linking, Local Graph Linking, and Dual-Graph Aggregation Mechanism. We
not only study the performance of our proposal empirically but also achieved
3rd place on the challenging Text-to-SQL benchmark Spider at the time of
writing.
- Abstract(参考訳): 質問の自然言語をSQLクエリに翻訳することを目的としたText-to-SQLタスクが最近注目を集めている。
Text-to-SQLの最も難しい問題のひとつは、トレーニング済みモデルを未知のデータベーススキーマに一般化する方法である。
鍵は一般化可能性にある
(i)質問をモデル化する符号化方法とデータベーススキーマ
(ii)問題中の単語とデータベーススキーマのテーブル/カラム間のマッピングを学ぶための質問・スキーマリンク手法。
上述の2つの課題に着目して、クロスドメインテキスト・トゥ・SQLのための構造対応デュアルグラフ集約ネットワーク(SADGA)を提案する。
SADGAでは、自然言語問題とデータベーススキーマの両方に統一的な符号化モデルを提供するために、グラフ構造を採用する。
提案する統一モデリングに基づいて,構造認識型アグリゲーション手法をさらに考案し,質問文とスキーマグラフのマッピングを学習する。
本手法は,Global Graph Linking,Local Graph Linking,Dual-Graph Aggregation Mechanismを特徴とする。
私たちは提案のパフォーマンスを実証的に研究するだけでなく、テキストからSQLへのベンチマークであるSpiderの書き込み時の3位を達成しました。
関連論文リスト
- UNITE: A Unified Benchmark for Text-to-SQL Evaluation [72.72040379293718]
テキスト・ツー・ドメイン・システムのためのUNIfiedベンチマークを導入する。
公開されているテキストからドメインへのデータセットと29Kデータベースで構成されている。
広く使われているSpiderベンチマークと比較すると、SQLパターンの3倍の増加が紹介されている。
論文 参考訳(メタデータ) (2023-05-25T17:19:52Z) - QURG: Question Rewriting Guided Context-Dependent Text-to-SQL Semantic
Parsing [46.05006486399823]
本稿では,モデルが適切な文脈理解を実現するのに役立つ新しい質問書き直し指導手法であるQURGを提案する。
まず、質問コンテキストに基づいて現在の質問を完了させるために質問書き換えモデルを訓練し、それらを書き換え編集行列に変換する。
さらに、2ストリームの行列エンコーダを設計し、質問とコンテキスト間の書き直し関係と、自然言語と構造化スキーマの関係をリンクするスキーマを共同でモデル化する。
論文 参考訳(メタデータ) (2023-05-11T08:45:55Z) - Prompting GPT-3.5 for Text-to-SQL with De-semanticization and Skeleton
Retrieval [17.747079214502673]
Text-to-は、自然言語の質問を構造化されたクエリ言語()に変換し、データベースから情報を取得するタスクである。
本稿では,テキスト・トゥ・テキストのための LLM ベースのフレームワークを提案する。
我々は,疑問骨格を抽出する非意味化機構を設計し,その構造的類似性に基づいて類似した例を検索する。
論文 参考訳(メタデータ) (2023-04-26T06:02:01Z) - A Survey on Text-to-SQL Parsing: Concepts, Methods, and Future
Directions [102.8606542189429]
テキストからコーパスへのパースの目的は、自然言語(NL)質問をデータベースが提供するエビデンスに基づいて、対応する構造化クエリ言語()に変換することである。
ディープニューラルネットワークは、入力NL質問から出力クエリへのマッピング関数を自動的に学習するニューラルジェネレーションモデルによって、このタスクを大幅に進歩させた。
論文 参考訳(メタデータ) (2022-08-29T14:24:13Z) - Semantic Enhanced Text-to-SQL Parsing via Iteratively Learning Schema
Linking Graph [6.13728903057727]
新しいデータベースへの一般化性は、人間の発話を insql 文を解析することを目的とした Text-to- システムにとって極めて重要である。
本稿では,質問トークンとデータベーススキーマ間のセマンティックなスキーマリンクグラフを反復的に構築するIS ESLというフレームワークを提案する。
3つのベンチマークでの大規模な実験により、IS ESLはベースラインを一貫して上回り、さらなる調査ではその一般化可能性と堅牢性を示している。
論文 参考訳(メタデータ) (2022-08-08T03:59:33Z) - Proton: Probing Schema Linking Information from Pre-trained Language
Models for Text-to-SQL Parsing [66.55478402233399]
本稿では,ポアンカー距離測定に基づく探索手法を用いて,関係構造を抽出する枠組みを提案する。
スキーマリンクの一般的なルールベース手法と比較して,探索関係は意味的対応をしっかりと捉えることができることがわかった。
我々のフレームワークは3つのベンチマークで最先端のパフォーマンスを新たに設定する。
論文 参考訳(メタデータ) (2022-06-28T14:05:25Z) - Dual Reader-Parser on Hybrid Textual and Tabular Evidence for Open
Domain Question Answering [78.9863753810787]
世界の知識は構造化データベースに保存されている。
クエリ言語は、複雑な推論を必要とする質問に答えるだけでなく、完全な説明可能性を提供することができる。
論文 参考訳(メタデータ) (2021-08-05T22:04:13Z) - ShadowGNN: Graph Projection Neural Network for Text-to-SQL Parser [36.12921337235763]
抽象レベルとセマンティックレベルでスキーマを処理する新しいアーキテクチャであるShadowGNNを提案します。
チャレンジングなText-to-Spiderベンチマークでは、経験的な結果がShadowGNNが最先端のモデルを上回ることを示しています。
論文 参考訳(メタデータ) (2021-04-10T05:48:28Z) - Bridging Textual and Tabular Data for Cross-Domain Text-to-SQL Semantic
Parsing [110.97778888305506]
BRIDGEは、フィールドのサブセットが質問に言及されたセル値で拡張されるタグ付きシーケンスの質問とDBスキーマを表します。
BRIDGEは、人気のクロスDBテキスト-リレーショナルベンチマークで最先端のパフォーマンスを達成しました。
本分析は,BRIDGEが望まれる相互依存を効果的に捕捉し,さらにテキストDB関連タスクに一般化する可能性を示唆している。
論文 参考訳(メタデータ) (2020-12-23T12:33:52Z) - IGSQL: Database Schema Interaction Graph Based Neural Model for
Context-Dependent Text-to-SQL Generation [61.09660709356527]
本稿では,データベーススキーマインタラクショングラフエンコーダを提案し,データベーススキーマ項目の履歴情報を利用する。
ベンチマークSParCおよびCoデータセットを用いて,本モデルの評価を行った。
論文 参考訳(メタデータ) (2020-11-11T12:56:21Z) - A Tale of Two Linkings: Dynamically Gating between Schema Linking and
Structural Linking for Text-to-SQL Parsing [25.81069211061945]
Text-to- semantic parsingでは、生成したsqlクエリの正しいエンティティを選択することは重要かつ困難である。
この課題に対処するための2つのリンクプロセス: 明示的なNLの言及をデータベースにリンクするスキーマリンクと、出力sqlのエンティティとデータベーススキーマの構造的関係をリンクする構造的リンク。
提案手法を2つのグラフニューラルネットワークに基づくセマンティクスとBERT表現と統合することにより,課題となるスパイダーデータセットのパース精度が大幅に向上したことを示す。
論文 参考訳(メタデータ) (2020-09-30T17:32:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。