論文の概要: Modern Baselines for SPARQL Semantic Parsing
- arxiv url: http://arxiv.org/abs/2204.12793v3
- Date: Thu, 14 Sep 2023 08:50:25 GMT
- ステータス: 処理完了
- システム内更新日: 2023-09-15 19:49:39.828812
- Title: Modern Baselines for SPARQL Semantic Parsing
- Title(参考訳): SPARQLセマンティックパーシングのためのモダンベースライン
- Authors: Debayan Banerjee, Pranav Ajit Nair, Jivat Neet Kaur, Ricardo Usbeck,
Chris Biemann
- Abstract要約: 我々は、自然言語の質問からSPARQLクエリを生成するタスクに焦点を当て、知識グラフ上で実行できる。
T5 は特別な入力トークン化を必要とするが,LC-QuAD 1.0 および LC-QuAD 2.0 データセット上でのアートパフォーマンスの状態を生成する。
この方法では、入力の一部を出力クエリにコピーする必要がある問題に対するセマンティック解析が可能となり、KGセマンティック解析における新しいパラダイムが実現される。
- 参考スコア(独自算出の注目度): 28.088516108293653
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In this work, we focus on the task of generating SPARQL queries from natural
language questions, which can then be executed on Knowledge Graphs (KGs). We
assume that gold entity and relations have been provided, and the remaining
task is to arrange them in the right order along with SPARQL vocabulary, and
input tokens to produce the correct SPARQL query. Pre-trained Language Models
(PLMs) have not been explored in depth on this task so far, so we experiment
with BART, T5 and PGNs (Pointer Generator Networks) with BERT embeddings,
looking for new baselines in the PLM era for this task, on DBpedia and Wikidata
KGs. We show that T5 requires special input tokenisation, but produces state of
the art performance on LC-QuAD 1.0 and LC-QuAD 2.0 datasets, and outperforms
task-specific models from previous works. Moreover, the methods enable semantic
parsing for questions where a part of the input needs to be copied to the
output query, thus enabling a new paradigm in KG semantic parsing.
- Abstract(参考訳): 本研究では,自然言語質問からSPARQLクエリを生成するタスクに着目し,知識グラフ(KG)上で実行することができる。
我々は、金の実体と関係が提供されており、残りのタスクは、SPARQL語彙と入力トークンと共にそれらを正しい順序でアレンジし、正しいSPARQLクエリを生成することであると仮定する。
事前学習された言語モデル(plm)は、これまでこのタスクについて深く検討されていないので、bert embeddedsでbart、t5、pgns(pointer generator networks)を実験し、このタスクのためにplm時代の新しいベースラインを探します。
T5は特別な入力トークン化を必要とするが,LC-QuAD 1.0およびLC-QuAD 2.0データセット上でのアートパフォーマンスの状態を生成し,タスク固有モデルよりも優れていることを示す。
さらに、入力の一部を出力クエリにコピーする必要がある問題に対するセマンティック解析を可能にし、KGセマンティック解析における新しいパラダイムを可能にする。
関連論文リスト
- Effective Instruction Parsing Plugin for Complex Logical Query Answering on Knowledge Graphs [51.33342412699939]
知識グラフクエリ埋め込み(KGQE)は、不完全なKGに対する複雑な推論のために、低次元KG空間に一階論理(FOL)クエリを埋め込むことを目的としている。
近年の研究では、FOLクエリの論理的セマンティクスをよりよく捉えるために、さまざまな外部情報(エンティティタイプや関係コンテキストなど)を統合している。
コードのようなクエリ命令から遅延クエリパターンをキャプチャする効果的なクエリ命令解析(QIPP)を提案する。
論文 参考訳(メタデータ) (2024-10-27T03:18:52Z) - Less is More: Making Smaller Language Models Competent Subgraph Retrievers for Multi-hop KGQA [51.3033125256716]
本研究では,小言語モデルで処理される条件生成タスクとして,サブグラフ検索タスクをモデル化する。
2億2千万のパラメータからなる基本生成部分グラフ検索モデルでは,最先端モデルと比較して競合検索性能が向上した。
LLMリーダを接続した最大の3Bモデルは、WebQSPとCWQベンチマークの両方で、SOTAのエンドツーエンドパフォーマンスを新たに設定します。
論文 参考訳(メタデータ) (2024-10-08T15:22:36Z) - Enhancing SPARQL Generation by Triplet-order-sensitive Pre-training [13.57710774520144]
新しい目的であるTriplet Order Correction(TOC)と、一般的に使われているMasked Language Modeling(MLM)を組み合わせた事前学習ステージを提案する。
提案手法は,広範に使用されている3つのベンチマークに対して,最先端の性能を実現する。
論文 参考訳(メタデータ) (2024-10-08T06:48:46Z) - The Role of Output Vocabulary in T2T LMs for SPARQL Semantic Parsing [20.734859343886843]
我々は、SPARQLセマンティック解析のタスクにおいて、テキスト・トゥ・テキスト(T2T)モデルにおける出力語彙の役割を分析する。
クエリに対して慎重に選択された語彙置換を行い、GrailQAデータセットの17%の範囲で絶対的なゲインを求める。
論文 参考訳(メタデータ) (2023-05-24T12:55:04Z) - GETT-QA: Graph Embedding based T2T Transformer for Knowledge Graph
Question Answering [20.734859343886843]
本稿では GETT-QA というエンド・ツー・エンドの知識グラフ質問応答システムを提案する。
GETT-QAは、人気のあるテキストからテキストまでの事前訓練言語モデルであるT5を使用している。
その結果,T5 は損失関数の変化を伴わずに絡み合った KG 埋め込みを学習でき,KGQA 性能が向上することがわかった。
論文 参考訳(メタデータ) (2023-03-23T14:06:26Z) - Semantic Parsing for Conversational Question Answering over Knowledge
Graphs [63.939700311269156]
本研究では,ユーザの質問にSparqlパースとアノテートし,システム回答が実行結果に対応するデータセットを開発する。
本稿では,2つの意味解析手法を提案し,その課題を強調した。
私たちのデータセットとモデルはhttps://github.com/Edinburgh/SPICE.orgで公開されています。
論文 参考訳(メタデータ) (2023-01-28T14:45:11Z) - Binding Language Models in Symbolic Languages [146.3027328556881]
Binderはトレーニング不要のニューラルシンボリックフレームワークで、タスク入力をプログラムにマッピングする。
解析の段階では、Codexは元のプログラミング言語では答えられないタスク入力の一部を特定することができる。
実行段階では、CodexはAPI呼び出しで適切なプロンプトを与えられた万能機能を実行することができる。
論文 参考訳(メタデータ) (2022-10-06T12:55:17Z) - Improving Text-to-SQL Semantic Parsing with Fine-grained Query
Understanding [84.04706075621013]
トークンレベルのきめ細かいクエリ理解に基づく汎用的モジュール型ニューラルネットワーク解析フレームワークを提案する。
我々のフレームワークは、名前付きエンティティ認識(NER)、ニューラルエンティティリンカ(NEL)、ニューラルエンティティリンカ(NSP)の3つのモジュールから構成されている。
論文 参考訳(メタデータ) (2022-09-28T21:00:30Z) - AutoQGS: Auto-Prompt for Low-Resource Knowledge-based Question
Generation from SPARQL [18.019353543946913]
本研究では,知識に基づく質問生成(KBQG)の課題について検討する。
従来のKBQGは知識グラフのファクトトリプルから質問を生成するが、これはSPARQLの集約や比較のような複雑な操作を表現できない。
本研究では,SPARQLをNL記述に書き換えるために,大規模教師なしデータに基づいて訓練された自動プロンプタを提案する。
論文 参考訳(メタデータ) (2022-08-26T06:53:46Z) - Improving Candidate Retrieval with Entity Profile Generation for
Wikidata Entity Linking [76.00737707718795]
本稿では,エンティティ・プロファイリングに基づく新しい候補探索パラダイムを提案する。
我々は、このプロファイルを使用してインデックス付き検索エンジンに問い合わせ、候補エンティティを検索する。
本手法は,ウィキペディアのアンカーテキスト辞書を用いた従来の手法を補完するものである。
論文 参考訳(メタデータ) (2022-02-27T17:38:53Z) - SPBERT: Pre-training BERT on SPARQL Queries for End-to-end Question
Answering over Knowledge Graphs [1.1775939485654976]
SPBERTは、大規模なSPARQLクエリログを事前トレーニングしたTransformerベースの言語モデルである。
本研究では,SPBERTとエンコーダデコーパスアーキテクチャを知識ベースQAコーパスに適用する方法について検討する。
論文 参考訳(メタデータ) (2021-06-18T08:39:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。