Fugu-MT 論文翻訳(概要): Syntactic Question Abstraction and Retrieval for Data-Scarce Semantic Parsing

論文の概要: Syntactic Question Abstraction and Retrieval for Data-Scarce Semantic Parsing

arxiv url: http://arxiv.org/abs/2005.00644v1
Date: Fri, 1 May 2020 23:05:55 GMT
ステータス: 翻訳完了
システム内更新日: 2022-12-07 23:00:06.125564
Title: Syntactic Question Abstraction and Retrieval for Data-Scarce Semantic Parsing
Title（参考訳）: データ・スカース・セマンティック・パーシングのための構文的質問抽象化と検索
Authors: Wonseok Hwang, Jinyeong Yim, Seunghyun Park, Minjoon Seo
Abstract要約: 本稿では,自然言語を論理形式に変換するニューラルセマンティクスを構築するために,SQAR(Syntactic Question Abstraction and Retrieval)を提案する。 SQARは、モデルを再トレーニングすることなく、新しい例を追加することで、目に見えない論理パターンを生成する。単純なパターン分類アプローチとは対照的に、SQARはモデルを再訓練することなく、目に見えない論理パターンを生成することができる。
参考スコア（独自算出の注目度）: 22.490892257736043
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Deep learning approaches to semantic parsing require a large amount of labeled data, but annotating complex logical forms is costly. Here, we propose Syntactic Question Abstraction and Retrieval (SQAR), a method to build a neural semantic parser that translates a natural language (NL) query to a SQL logical form (LF) with less than 1,000 annotated examples. SQAR first retrieves a logical pattern from the train data by computing the similarity between NL queries and then grounds a lexical information on the retrieved pattern in order to generate the final LF. We validate SQAR by training models using various small subsets of WikiSQL train data achieving up to 4.9% higher LF accuracy compared to the previous state-of-the-art models on WikiSQL test set. We also show that by using query-similarity to retrieve logical pattern, SQAR can leverage a paraphrasing dataset achieving up to 5.9% higher LF accuracy compared to the case where SQAR is trained by using only WikiSQL data. In contrast to a simple pattern classification approach, SQAR can generate unseen logical patterns upon the addition of new examples without re-training the model. We also discuss an ideal way to create cost efficient and robust train datasets when the data distribution can be approximated under a data-hungry setting.
Abstract（参考訳）: 意味解析への深層学習アプローチは大量のラベル付きデータを必要とするが、複雑な論理形式を注釈付けすることはコストがかかる。本稿では、自然言語(NL)クエリを1000例未満の注釈付き例でSQL論理形式(LF)に変換するニューラルセマンティックパーサを構築するためのSQAR(Syntactic Question Abstraction and Retrieval)を提案する。 sqarは、まず、nlクエリ間の類似度を計算して、列車データから論理パターンを検索し、その後、検索されたパターンの語彙情報に基づいて最終的なlfを生成する。我々は、WikiSQLテストセットの以前の最先端モデルと比較して、LF精度を最大4.9%向上させるWikiSQLトレインデータの様々な小さなサブセットを用いて、トレーニングモデルを用いてSQARを検証する。また,SQARは論理パターンの検索にクエリ類似性を用いることで,WikiSQLデータのみを用いてSQARを訓練した場合と比較して,LF精度が最大5.9%向上するパラフレーズデータセットを利用できることを示す。単純なパターン分類アプローチとは対照的に、SQARはモデルを再トレーニングすることなく、新しい例を追加することで、目に見えない論理パターンを生成することができる。また,データヒングリー設定の下でデータ分布を近似できる場合,コスト効率が高くロバストなトレインデータセットを作成するための理想的な方法についても論じる。

関連論文リスト

SPARTA: Scalable and Principled Benchmark of Tree-Structured Multi-hop QA over Text and Tables [13.249024309069236]
テーブルテキスト質問応答タスクは、長いテキストとソーステーブルをまたいで推論し、複数のホップをトラバースし、集約のような複雑な操作を実行するモデルを必要とする。本稿では,大規模テーブルテキストQAベンチマークを自動的に生成し,軽量な人体検証を行うエンドツーエンド構築フレームワークであるSPARTAを提案する。 SPARTAでは、HybridQAで70F1以上、OTT-QAで50F1以上に達する最先端モデルが30F1ポイント以上減少する。
論文参考訳（メタデータ） (2026-02-26T17:59:51Z)
ComLQ: Benchmarking Complex Logical Queries in Information Retrieval [26.606215927237248]
情報検索システムは,様々なアプリケーションにまたがる情報過負荷をナビゲートする上で重要な役割を担っている。これらのベンチマークは、現実世界のシナリオにおける複雑なクエリ上でのIRモデルの性能を十分に評価するためには使用できない。大規模言語モデル(LLM)を利用してtextbfComplex textbfLogical textbfQueries 用の新しいIRデータセット textbfComLQ を構築する手法を提案する。
論文参考訳（メタデータ） (2025-11-15T02:58:21Z)
SchemaGraphSQL: Efficient Schema Linking with Pathfinding Graph Algorithms for Text-to-SQL on Large-Scale Databases [1.6544167074080365]
本稿では、まず、外部キー関係に基づくスキーマグラフを構築する、ゼロショットでトレーニング不要なスキーマリンク手法を提案する。我々は、結合すべきテーブルや列の最適なシーケンスを特定するために、古典的なパスフィニングアルゴリズムと後処理を適用する。提案手法はBIRDベンチマークの最先端結果を実現し,従来の特殊化,微調整,複雑な多段階LCMに基づくアプローチよりも優れていた。
論文参考訳（メタデータ） (2025-05-23T20:42:36Z)
Rationalization Models for Text-to-SQL [13.792561265515003]
本稿では,テキスト・ツー・シークレット・モデルの微調整を強化するために,CoT(Chain-of-Thought)論理を生成するフレームワークを提案する。プロセスは、手動でサンプルの小さなセットをアノテートすることから始まり、その後、大きな言語モデルを促すために使用される。その後、検証されたクエリに基づいて合理化モデルをトレーニングし、広範な合成CoTアノテーションを可能にする。
論文参考訳（メタデータ） (2025-02-10T18:38:57Z)
Effective Instruction Parsing Plugin for Complex Logical Query Answering on Knowledge Graphs [51.33342412699939]
知識グラフクエリ埋め込み(KGQE)は、不完全なKGに対する複雑な推論のために、低次元KG空間に一階論理(FOL)クエリを埋め込むことを目的としている。近年の研究では、FOLクエリの論理的セマンティクスをよりよく捉えるために、さまざまな外部情報(エンティティタイプや関係コンテキストなど)を統合している。コードのようなクエリ命令から遅延クエリパターンをキャプチャする効果的なクエリ命令解析(QIPP)を提案する。
論文参考訳（メタデータ） (2024-10-27T03:18:52Z)
Less is More: Making Smaller Language Models Competent Subgraph Retrievers for Multi-hop KGQA [51.3033125256716]
本研究では,小言語モデルで処理される条件生成タスクとして,サブグラフ検索タスクをモデル化する。 2億2千万のパラメータからなる基本生成部分グラフ検索モデルでは,最先端モデルと比較して競合検索性能が向上した。 LLMリーダを接続した最大の3Bモデルは、WebQSPとCWQベンチマークの両方で、SOTAのエンドツーエンドパフォーマンスを新たに設定します。
論文参考訳（メタデータ） (2024-10-08T15:22:36Z)
MeaeQ: Mount Model Extraction Attacks with Efficient Queries [6.1106195466129485]
自然言語処理(NLP)におけるモデル抽出攻撃の研究これらの問題に対処する単純で効果的な方法であるMeaeQを提案する。 MeaeQは、クエリを少なくしながら、ベースラインよりも犠牲者モデルに高い機能的類似性を実現する。
論文参考訳（メタデータ） (2023-10-21T16:07:16Z)
Improving Text-to-SQL Semantic Parsing with Fine-grained Query Understanding [84.04706075621013]
トークンレベルのきめ細かいクエリ理解に基づく汎用的モジュール型ニューラルネットワーク解析フレームワークを提案する。我々のフレームワークは、名前付きエンティティ認識(NER)、ニューラルエンティティリンカ(NEL)、ニューラルエンティティリンカ(NSP)の3つのモジュールから構成されている。
論文参考訳（メタデータ） (2022-09-28T21:00:30Z)
Proton: Probing Schema Linking Information from Pre-trained Language Models for Text-to-SQL Parsing [66.55478402233399]
本稿では,ポアンカー距離測定に基づく探索手法を用いて,関係構造を抽出する枠組みを提案する。スキーマリンクの一般的なルールベース手法と比較して,探索関係は意味的対応をしっかりと捉えることができることがわかった。我々のフレームワークは3つのベンチマークで最先端のパフォーマンスを新たに設定する。
論文参考訳（メタデータ） (2022-06-28T14:05:25Z)
Logical Reasoning for Task Oriented Dialogue Systems [57.440956636333325]
本稿では,ロバータやT5などの変圧器モデルに対して,与えられた対話コンテキストにおける事実の集合を推論する新しい手法を提案する。本手法は,モデルが論理関係を学習するのに役立つ合成データ生成機構を含む。対話コンテキストが全ての必要な情報を含む場合、変換器に基づくモデルが論理的推論を行い、質問に答えることを示す。
論文参考訳（メタデータ） (2022-02-08T21:46:27Z)
Weakly Supervised Text-to-SQL Parsing through Question Decomposition [53.22128541030441]
我々は最近提案されたQDMR(QDMR)という意味表現を活用している。質問やQDMR構造(非専門家によって注釈付けされたり、自動予測されたりする)、回答が与えられたら、我々は自動的にsqlクエリを合成できる。本結果は,NL-ベンチマークデータを用いて訓練したモデルと,弱い教師付きモデルが競合することを示す。
論文参考訳（メタデータ） (2021-12-12T20:02:42Z)
SPARQLing Database Queries from Intermediate Question Decompositions [7.475027071883912]
自然言語の質問をデータベースクエリに変換するために、ほとんどのアプローチは、完全に注釈付けされたトレーニングセットに依存している。データベースの中間問題表現を基盤として,この負担を軽減する。我々のパイプラインは、自然言語質問を中間表現に変換するセマンティックと、訓練不能なトランスパイラをQLSPARクエリ言語に変換する2つの部分から構成される。
論文参考訳（メタデータ） (2021-09-13T17:57:12Z)
Generation of complex database queries and API calls from natural language utterances [0.0]
本稿では,クエリ生成問題を意図分類とスロット充填問題に変換する手法を提案する。トレーニングデータセットに類似した質問に対しては、高い精度で複雑なクエリを生成する。その他の質問では、テンプレートベースのアプローチやクエリ要素を予測してクエリを構築することができ、シーケンス・ツー・シーケンスモデルよりも高い精度で実行することができる。
論文参考訳（メタデータ） (2020-12-15T08:28:52Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。