論文の概要: Proton: Probing Schema Linking Information from Pre-trained Language
Models for Text-to-SQL Parsing
- arxiv url: http://arxiv.org/abs/2206.14017v1
- Date: Tue, 28 Jun 2022 14:05:25 GMT
- ステータス: 処理完了
- システム内更新日: 2022-06-29 13:39:54.950686
- Title: Proton: Probing Schema Linking Information from Pre-trained Language
Models for Text-to-SQL Parsing
- Title(参考訳): Proton: テキスト-SQL構文解析のための事前訓練済み言語モデルから情報をリンクするスキーマの提案
- Authors: Lihan Wang, Bowen Qin, Binyuan Hui, Bowen Li, Min Yang, Bailin Wang,
Binhua Li, Fei Huang, Luo Si, Yongbin Li
- Abstract要約: 本稿では,ポアンカー距離測定に基づく探索手法を用いて,関係構造を抽出する枠組みを提案する。
スキーマリンクの一般的なルールベース手法と比較して,探索関係は意味的対応をしっかりと捉えることができることがわかった。
我々のフレームワークは3つのベンチマークで最先端のパフォーマンスを新たに設定する。
- 参考スコア(独自算出の注目度): 66.55478402233399
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The importance of building text-to-SQL parsers which can be applied to new
databases has long been acknowledged, and a critical step to achieve this goal
is schema linking, i.e., properly recognizing mentions of unseen columns or
tables when generating SQLs. In this work, we propose a novel framework to
elicit relational structures from large-scale pre-trained language models
(PLMs) via a probing procedure based on Poincar\'e distance metric, and use the
induced relations to augment current graph-based parsers for better schema
linking. Compared with commonly-used rule-based methods for schema linking, we
found that probing relations can robustly capture semantic correspondences,
even when surface forms of mentions and entities differ. Moreover, our probing
procedure is entirely unsupervised and requires no additional parameters.
Extensive experiments show that our framework sets new state-of-the-art
performance on three benchmarks. We empirically verify that our probing
procedure can indeed find desired relational structures through qualitative
analysis.
- Abstract(参考訳): 新しいデータベースに適用可能なテキストからSQLへのパーサを構築することの重要性は以前から認識されており、この目標を達成するための重要なステップはスキーマリンクである。
本研究では,Poincar\'e距離測定に基づく探索手法を用いて,大規模事前学習言語モデル(PLM)から関係構造を抽出する新しいフレームワークを提案する。
スキーマリンクの一般的なルールベース手法と比較して,表層形態の言及や実体が異なる場合でも,探索関係は意味的対応をしっかりと捉えることができることがわかった。
さらに, 探索手順は完全に教師なしであり, 追加パラメータは不要である。
広範な実験によって、フレームワークは3つのベンチマークで最先端のパフォーマンスを新たに設定できることが分かりました。
定性的解析により,提案手法が本当に望ましい関係構造を見出すことができることを実証的に検証した。
関連論文リスト
- The Death of Schema Linking? Text-to-SQL in the Age of Well-Reasoned Language Models [0.9149661171430259]
次世代の大規模言語モデル(LLM)を使用する場合のスキーマリンクを再検討する。
より新しいモデルでは,無関係なモデルが多数存在する場合でも,生成時に関連するスキーマ要素を利用することが可能であることが実証的に判明した。
文脈情報をフィルタリングする代わりに、拡張、選択、修正などのテクニックを強調し、テキストからBIRDパイプラインの精度を向上させるためにそれらを採用する。
論文 参考訳(メタデータ) (2024-08-14T17:59:04Z) - Schema-Aware Multi-Task Learning for Complex Text-to-SQL [4.913409359995421]
複雑なsqlクエリのためのスキーマ対応マルチタスク学習フレームワーク(MT)を提案する。
具体的には、有効な質問スキーマリンクを識別するために、識別器モジュールを設計する。
デコーダ側では、テーブルと列の接続を記述するために、6種類の関係を定義します。
論文 参考訳(メタデータ) (2024-03-09T01:13:37Z) - STAR: SQL Guided Pre-Training for Context-dependent Text-to-SQL Parsing [64.80483736666123]
文脈依存型テキスト・ツー・パースのための新しい事前学習フレームワークSTARを提案する。
さらに,STARを事前学習するための大規模コンテキスト依存型テキスト対話コーパスを構築した。
大規模な実験により、STARは2つの下流ベンチマークで新しい最先端のパフォーマンスを達成することが示された。
論文 参考訳(メタデータ) (2022-10-21T11:30:07Z) - Improving Text-to-SQL Semantic Parsing with Fine-grained Query
Understanding [84.04706075621013]
トークンレベルのきめ細かいクエリ理解に基づく汎用的モジュール型ニューラルネットワーク解析フレームワークを提案する。
我々のフレームワークは、名前付きエンティティ認識(NER)、ニューラルエンティティリンカ(NEL)、ニューラルエンティティリンカ(NSP)の3つのモジュールから構成されている。
論文 参考訳(メタデータ) (2022-09-28T21:00:30Z) - Semantic Enhanced Text-to-SQL Parsing via Iteratively Learning Schema
Linking Graph [6.13728903057727]
新しいデータベースへの一般化性は、人間の発話を insql 文を解析することを目的とした Text-to- システムにとって極めて重要である。
本稿では,質問トークンとデータベーススキーマ間のセマンティックなスキーマリンクグラフを反復的に構築するIS ESLというフレームワークを提案する。
3つのベンチマークでの大規模な実験により、IS ESLはベースラインを一貫して上回り、さらなる調査ではその一般化可能性と堅牢性を示している。
論文 参考訳(メタデータ) (2022-08-08T03:59:33Z) - RASAT: Integrating Relational Structures into Pretrained Seq2Seq Model
for Text-to-SQL [37.173390754207766]
本稿では,リレーショナルアウェア・セルフアテンションを付加したTransformer seq2seqアーキテクチャを提案する。
我々のモデルは、文献にはほとんど全ての種類の既存の関係を組み込むことができる。
論文 参考訳(メタデータ) (2022-05-14T06:27:40Z) - Learning to Synthesize Data for Semantic Parsing [57.190817162674875]
本稿では,プログラムの構成をモデル化し,プログラムを発話にマップする生成モデルを提案する。
PCFGと事前学習されたBARTの簡易性により,既存のデータから効率的に生成モデルを学習することができる。
GeoQuery と Spider の標準ベンチマークで解析する text-to-Query の in-domain と out-of-domain の両方で、この手法を評価します。
論文 参考訳(メタデータ) (2021-04-12T21:24:02Z) - Bridging Textual and Tabular Data for Cross-Domain Text-to-SQL Semantic
Parsing [110.97778888305506]
BRIDGEは、フィールドのサブセットが質問に言及されたセル値で拡張されるタグ付きシーケンスの質問とDBスキーマを表します。
BRIDGEは、人気のクロスDBテキスト-リレーショナルベンチマークで最先端のパフォーマンスを達成しました。
本分析は,BRIDGEが望まれる相互依存を効果的に捕捉し,さらにテキストDB関連タスクに一般化する可能性を示唆している。
論文 参考訳(メタデータ) (2020-12-23T12:33:52Z) - A Tale of Two Linkings: Dynamically Gating between Schema Linking and
Structural Linking for Text-to-SQL Parsing [25.81069211061945]
Text-to- semantic parsingでは、生成したsqlクエリの正しいエンティティを選択することは重要かつ困難である。
この課題に対処するための2つのリンクプロセス: 明示的なNLの言及をデータベースにリンクするスキーマリンクと、出力sqlのエンティティとデータベーススキーマの構造的関係をリンクする構造的リンク。
提案手法を2つのグラフニューラルネットワークに基づくセマンティクスとBERT表現と統合することにより,課題となるスパイダーデータセットのパース精度が大幅に向上したことを示す。
論文 参考訳(メタデータ) (2020-09-30T17:32:27Z) - GraPPa: Grammar-Augmented Pre-Training for Table Semantic Parsing [117.98107557103877]
テーブルセマンティック解析のための効果的な事前学習手法GraPPaを提案する。
我々は、同期文脈自由文法を用いて、高自由度テーブル上に合成質問ペアを構築する。
実世界のデータを表現できるモデルの能力を維持するため、マスキング言語モデリングも含んでいる。
論文 参考訳(メタデータ) (2020-09-29T08:17:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。