論文の概要: Semantic Enhanced Text-to-SQL Parsing via Iteratively Learning Schema
Linking Graph
- arxiv url: http://arxiv.org/abs/2208.03903v1
- Date: Mon, 8 Aug 2022 03:59:33 GMT
- ステータス: 処理完了
- システム内更新日: 2022-08-09 13:10:09.876754
- Title: Semantic Enhanced Text-to-SQL Parsing via Iteratively Learning Schema
Linking Graph
- Title(参考訳): 反復学習型スキーマリンクグラフによるセマンティックテキスト-SQL構文解析
- Authors: Aiwei Liu, Xuming Hu, Li Lin and Lijie Wen
- Abstract要約: 新しいデータベースへの一般化性は、人間の発話を insql 文を解析することを目的とした Text-to- システムにとって極めて重要である。
本稿では,質問トークンとデータベーススキーマ間のセマンティックなスキーマリンクグラフを反復的に構築するIS ESLというフレームワークを提案する。
3つのベンチマークでの大規模な実験により、IS ESLはベースラインを一貫して上回り、さらなる調査ではその一般化可能性と堅牢性を示している。
- 参考スコア(独自算出の注目度): 6.13728903057727
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The generalizability to new databases is of vital importance to Text-to-SQL
systems which aim to parse human utterances into SQL statements. Existing works
achieve this goal by leveraging the exact matching method to identify the
lexical matching between the question words and the schema items. However,
these methods fail in other challenging scenarios, such as the synonym
substitution in which the surface form differs between the corresponding
question words and schema items. In this paper, we propose a framework named
ISESL-SQL to iteratively build a semantic enhanced schema-linking graph between
question tokens and database schemas. First, we extract a schema linking graph
from PLMs through a probing procedure in an unsupervised manner. Then the
schema linking graph is further optimized during the training process through a
deep graph learning method. Meanwhile, we also design an auxiliary task called
graph regularization to improve the schema information mentioned in the
schema-linking graph. Extensive experiments on three benchmarks demonstrate
that ISESL-SQL could consistently outperform the baselines and further
investigations show its generalizability and robustness.
- Abstract(参考訳): 新しいデータベースへの一般化性は、人間の発話をSQLステートメントに解析することを目的としたText-to-SQLシステムにとって極めて重要である。
既存の作業は、質問語とスキーマ項目の語彙マッチングを識別するために、正確なマッチング手法を活用することで、この目標を達成する。
しかし、これらの方法は、対応する質問語とスキーマ項目の間で表面形式が異なる同義語置換のような他の難しいシナリオでは失敗する。
本稿では,問合せトークンとデータベーススキーマ間のセマンティック拡張スキーマリンクグラフを反復的に構築するISESL-SQLというフレームワークを提案する。
まず,plmからのスキーマリンクグラフを,教師なしの方法で探索手順で抽出する。
次に、深層グラフ学習法により、トレーニングプロセス中にスキーマリンクグラフをさらに最適化する。
また,スキーマリンクグラフのスキーマ情報を改善するために,グラフ正規化と呼ばれる補助タスクも設計する。
3つのベンチマークでの大規模な実験により、ISESL-SQLはベースラインを一貫して上回り、さらなる調査ではその一般化性と堅牢性を示している。
関連論文リスト
- RSL-SQL: Robust Schema Linking in Text-to-SQL Generation [51.00761167842468]
本稿では、双方向スキーマリンク、コンテキスト情報拡張、バイナリ選択戦略、マルチターン自己補正を組み合わせたRSLと呼ばれる新しいフレームワークを提案する。
ベンチマークの結果,オープンソースのソリューション間でのSOTA実行精度は67.2%,BIRDは87.9%,GPT-4オクルージョンは87.9%であった。
提案手法は,DeepSeekを同一のプロンプトで適用した場合,GPT-4ベースのテキスト・ツー・シークシステムよりも優れている。
論文 参考訳(メタデータ) (2024-10-31T16:22:26Z) - The Death of Schema Linking? Text-to-SQL in the Age of Well-Reasoned Language Models [0.9149661171430259]
次世代の大規模言語モデル(LLM)を使用する場合のスキーマリンクを再検討する。
より新しいモデルでは,無関係なモデルが多数存在する場合でも,生成時に関連するスキーマ要素を利用することが可能であることが実証的に判明した。
文脈情報をフィルタリングする代わりに、拡張、選択、修正などのテクニックを強調し、テキストからBIRDパイプラインの精度を向上させるためにそれらを採用する。
論文 参考訳(メタデータ) (2024-08-14T17:59:04Z) - Schema-Aware Multi-Task Learning for Complex Text-to-SQL [4.913409359995421]
複雑なsqlクエリのためのスキーマ対応マルチタスク学習フレームワーク(MT)を提案する。
具体的には、有効な質問スキーマリンクを識別するために、識別器モジュールを設計する。
デコーダ側では、テーブルと列の接続を記述するために、6種類の関係を定義します。
論文 参考訳(メタデータ) (2024-03-09T01:13:37Z) - Schema-adaptable Knowledge Graph Construction [47.772335354080795]
従来の知識グラフ構築(KGC)アプローチは、通常、事前定義されたスキーマの閉じたセットで静的情報抽出パラダイムに従う。
我々は,スキーマ適応型KGCと呼ばれる新しいタスクを提案する。このタスクは,動的に変化するスキーマグラフに基づいて,再学習せずにエンティティ,リレーション,イベントを継続的に抽出することを目的としている。
論文 参考訳(メタデータ) (2023-05-15T15:06:20Z) - STAR: SQL Guided Pre-Training for Context-dependent Text-to-SQL Parsing [64.80483736666123]
文脈依存型テキスト・ツー・パースのための新しい事前学習フレームワークSTARを提案する。
さらに,STARを事前学習するための大規模コンテキスト依存型テキスト対話コーパスを構築した。
大規模な実験により、STARは2つの下流ベンチマークで新しい最先端のパフォーマンスを達成することが示された。
論文 参考訳(メタデータ) (2022-10-21T11:30:07Z) - Proton: Probing Schema Linking Information from Pre-trained Language
Models for Text-to-SQL Parsing [66.55478402233399]
本稿では,ポアンカー距離測定に基づく探索手法を用いて,関係構造を抽出する枠組みを提案する。
スキーマリンクの一般的なルールベース手法と比較して,探索関係は意味的対応をしっかりと捉えることができることがわかった。
我々のフレームワークは3つのベンチマークで最先端のパフォーマンスを新たに設定する。
論文 参考訳(メタデータ) (2022-06-28T14:05:25Z) - SADGA: Structure-Aware Dual Graph Aggregation Network for Text-to-SQL [29.328698264910596]
Text-to-Graphの最も難しい問題の1つは、トレーニングされたモデルを見えないデータベーススキーマに一般化する方法である。
クロスドメインテキスト・トゥ・グラフのための構造対応デュアルグラフアグリゲーションネットワーク(SADGA)を提案する。
執筆時点では、挑戦的なText-to-GraphベンチマークのSpiderで3位を獲得しました。
論文 参考訳(メタデータ) (2021-11-01T01:50:28Z) - ShadowGNN: Graph Projection Neural Network for Text-to-SQL Parser [36.12921337235763]
抽象レベルとセマンティックレベルでスキーマを処理する新しいアーキテクチャであるShadowGNNを提案します。
チャレンジングなText-to-Spiderベンチマークでは、経験的な結果がShadowGNNが最先端のモデルを上回ることを示しています。
論文 参考訳(メタデータ) (2021-04-10T05:48:28Z) - IGSQL: Database Schema Interaction Graph Based Neural Model for
Context-Dependent Text-to-SQL Generation [61.09660709356527]
本稿では,データベーススキーマインタラクショングラフエンコーダを提案し,データベーススキーマ項目の履歴情報を利用する。
ベンチマークSParCおよびCoデータセットを用いて,本モデルの評価を行った。
論文 参考訳(メタデータ) (2020-11-11T12:56:21Z) - GraPPa: Grammar-Augmented Pre-Training for Table Semantic Parsing [117.98107557103877]
テーブルセマンティック解析のための効果的な事前学習手法GraPPaを提案する。
我々は、同期文脈自由文法を用いて、高自由度テーブル上に合成質問ペアを構築する。
実世界のデータを表現できるモデルの能力を維持するため、マスキング言語モデリングも含んでいる。
論文 参考訳(メタデータ) (2020-09-29T08:17:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。