論文の概要: Syntactic Question Abstraction and Retrieval for Data-Scarce Semantic
Parsing
- arxiv url: http://arxiv.org/abs/2005.00644v1
- Date: Fri, 1 May 2020 23:05:55 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-07 23:00:06.125564
- Title: Syntactic Question Abstraction and Retrieval for Data-Scarce Semantic
Parsing
- Title(参考訳): データ・スカース・セマンティック・パーシングのための構文的質問抽象化と検索
- Authors: Wonseok Hwang, Jinyeong Yim, Seunghyun Park, Minjoon Seo
- Abstract要約: 本稿では,自然言語を論理形式に変換するニューラルセマンティクスを構築するために,SQAR(Syntactic Question Abstraction and Retrieval)を提案する。
SQARは、モデルを再トレーニングすることなく、新しい例を追加することで、目に見えない論理パターンを生成する。
単純なパターン分類アプローチとは対照的に、SQARはモデルを再訓練することなく、目に見えない論理パターンを生成することができる。
- 参考スコア(独自算出の注目度): 22.490892257736043
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Deep learning approaches to semantic parsing require a large amount of
labeled data, but annotating complex logical forms is costly. Here, we propose
Syntactic Question Abstraction and Retrieval (SQAR), a method to build a neural
semantic parser that translates a natural language (NL) query to a SQL logical
form (LF) with less than 1,000 annotated examples. SQAR first retrieves a
logical pattern from the train data by computing the similarity between NL
queries and then grounds a lexical information on the retrieved pattern in
order to generate the final LF. We validate SQAR by training models using
various small subsets of WikiSQL train data achieving up to 4.9% higher LF
accuracy compared to the previous state-of-the-art models on WikiSQL test set.
We also show that by using query-similarity to retrieve logical pattern, SQAR
can leverage a paraphrasing dataset achieving up to 5.9% higher LF accuracy
compared to the case where SQAR is trained by using only WikiSQL data. In
contrast to a simple pattern classification approach, SQAR can generate unseen
logical patterns upon the addition of new examples without re-training the
model. We also discuss an ideal way to create cost efficient and robust train
datasets when the data distribution can be approximated under a data-hungry
setting.
- Abstract(参考訳): 意味解析への深層学習アプローチは大量のラベル付きデータを必要とするが、複雑な論理形式を注釈付けすることはコストがかかる。
本稿では、自然言語(NL)クエリを1000例未満の注釈付き例でSQL論理形式(LF)に変換するニューラルセマンティックパーサを構築するためのSQAR(Syntactic Question Abstraction and Retrieval)を提案する。
sqarは、まず、nlクエリ間の類似度を計算して、列車データから論理パターンを検索し、その後、検索されたパターンの語彙情報に基づいて最終的なlfを生成する。
我々は、WikiSQLテストセットの以前の最先端モデルと比較して、LF精度を最大4.9%向上させるWikiSQLトレインデータの様々な小さなサブセットを用いて、トレーニングモデルを用いてSQARを検証する。
また,SQARは論理パターンの検索にクエリ類似性を用いることで,WikiSQLデータのみを用いてSQARを訓練した場合と比較して,LF精度が最大5.9%向上するパラフレーズデータセットを利用できることを示す。
単純なパターン分類アプローチとは対照的に、SQARはモデルを再トレーニングすることなく、新しい例を追加することで、目に見えない論理パターンを生成することができる。
また,データヒングリー設定の下でデータ分布を近似できる場合,コスト効率が高くロバストなトレインデータセットを作成するための理想的な方法についても論じる。
関連論文リスト
- Effective Instruction Parsing Plugin for Complex Logical Query Answering on Knowledge Graphs [51.33342412699939]
知識グラフクエリ埋め込み(KGQE)は、不完全なKGに対する複雑な推論のために、低次元KG空間に一階論理(FOL)クエリを埋め込むことを目的としている。
近年の研究では、FOLクエリの論理的セマンティクスをよりよく捉えるために、さまざまな外部情報(エンティティタイプや関係コンテキストなど)を統合している。
コードのようなクエリ命令から遅延クエリパターンをキャプチャする効果的なクエリ命令解析(QIPP)を提案する。
論文 参考訳(メタデータ) (2024-10-27T03:18:52Z) - Less is More: Making Smaller Language Models Competent Subgraph Retrievers for Multi-hop KGQA [51.3033125256716]
本研究では,小言語モデルで処理される条件生成タスクとして,サブグラフ検索タスクをモデル化する。
2億2千万のパラメータからなる基本生成部分グラフ検索モデルでは,最先端モデルと比較して競合検索性能が向上した。
LLMリーダを接続した最大の3Bモデルは、WebQSPとCWQベンチマークの両方で、SOTAのエンドツーエンドパフォーマンスを新たに設定します。
論文 参考訳(メタデータ) (2024-10-08T15:22:36Z) - MeaeQ: Mount Model Extraction Attacks with Efficient Queries [6.1106195466129485]
自然言語処理(NLP)におけるモデル抽出攻撃の研究
これらの問題に対処する単純で効果的な方法であるMeaeQを提案する。
MeaeQは、クエリを少なくしながら、ベースラインよりも犠牲者モデルに高い機能的類似性を実現する。
論文 参考訳(メタデータ) (2023-10-21T16:07:16Z) - Improving Text-to-SQL Semantic Parsing with Fine-grained Query
Understanding [84.04706075621013]
トークンレベルのきめ細かいクエリ理解に基づく汎用的モジュール型ニューラルネットワーク解析フレームワークを提案する。
我々のフレームワークは、名前付きエンティティ認識(NER)、ニューラルエンティティリンカ(NEL)、ニューラルエンティティリンカ(NSP)の3つのモジュールから構成されている。
論文 参考訳(メタデータ) (2022-09-28T21:00:30Z) - Proton: Probing Schema Linking Information from Pre-trained Language
Models for Text-to-SQL Parsing [66.55478402233399]
本稿では,ポアンカー距離測定に基づく探索手法を用いて,関係構造を抽出する枠組みを提案する。
スキーマリンクの一般的なルールベース手法と比較して,探索関係は意味的対応をしっかりと捉えることができることがわかった。
我々のフレームワークは3つのベンチマークで最先端のパフォーマンスを新たに設定する。
論文 参考訳(メタデータ) (2022-06-28T14:05:25Z) - Logical Reasoning for Task Oriented Dialogue Systems [57.440956636333325]
本稿では,ロバータやT5などの変圧器モデルに対して,与えられた対話コンテキストにおける事実の集合を推論する新しい手法を提案する。
本手法は,モデルが論理関係を学習するのに役立つ合成データ生成機構を含む。
対話コンテキストが全ての必要な情報を含む場合、変換器に基づくモデルが論理的推論を行い、質問に答えることを示す。
論文 参考訳(メタデータ) (2022-02-08T21:46:27Z) - Weakly Supervised Text-to-SQL Parsing through Question Decomposition [53.22128541030441]
我々は最近提案されたQDMR(QDMR)という意味表現を活用している。
質問やQDMR構造(非専門家によって注釈付けされたり、自動予測されたりする)、回答が与えられたら、我々は自動的にsqlクエリを合成できる。
本結果は,NL-ベンチマークデータを用いて訓練したモデルと,弱い教師付きモデルが競合することを示す。
論文 参考訳(メタデータ) (2021-12-12T20:02:42Z) - SPARQLing Database Queries from Intermediate Question Decompositions [7.475027071883912]
自然言語の質問をデータベースクエリに変換するために、ほとんどのアプローチは、完全に注釈付けされたトレーニングセットに依存している。
データベースの中間問題表現を基盤として,この負担を軽減する。
我々のパイプラインは、自然言語質問を中間表現に変換するセマンティックと、訓練不能なトランスパイラをQLSPARクエリ言語に変換する2つの部分から構成される。
論文 参考訳(メタデータ) (2021-09-13T17:57:12Z) - Generation of complex database queries and API calls from natural
language utterances [0.0]
本稿では,クエリ生成問題を意図分類とスロット充填問題に変換する手法を提案する。
トレーニングデータセットに類似した質問に対しては、高い精度で複雑なクエリを生成する。
その他の質問では、テンプレートベースのアプローチやクエリ要素を予測してクエリを構築することができ、シーケンス・ツー・シーケンスモデルよりも高い精度で実行することができる。
論文 参考訳(メタデータ) (2020-12-15T08:28:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。