論文の概要: Semantic Parsing with Candidate Expressions for Knowledge Base Question Answering
- arxiv url: http://arxiv.org/abs/2410.00414v2
- Date: Sun, 13 Oct 2024 22:15:41 GMT
- ステータス: 処理完了
- システム内更新日: 2024-11-05 05:46:46.166370
- Title: Semantic Parsing with Candidate Expressions for Knowledge Base Question Answering
- Title(参考訳): 知識ベース質問応答のための候補表現を用いた意味的構文解析
- Authors: Daehwan Nam, Gary Geunbae Lee,
- Abstract要約: 大規模知識ベース(KB)を用いた意味解析のための候補表現を付加した文法を提案する。
文法は、アクションを生産規則として定義し、我々の意味論は、型と候補式による制約の下での推論中のアクションを予測する。
我々のセマンティックスはKQA ProとOvernightで最先端のアキュラシーを達成し、その実装はhttps://www.daehwannam.com/daehwannam/candexpr-sp.git.comで公開されています。
- 参考スコア(独自算出の注目度): 4.795837146925278
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Semantic parsers convert natural language to logical forms, which can be evaluated on knowledge bases (KBs) to produce denotations. Recent semantic parsers have been developed with sequence-to-sequence (seq2seq) pre-trained language models (PLMs) or large language models, where the models treat logical forms as sequences of tokens. For syntactic and semantic validity, the semantic parsers use grammars that enable constrained decoding. However, the grammars lack the ability to utilize large information of KBs, although logical forms contain representations of KB elements, such as entities or relations. In this work, we propose a grammar augmented with candidate expressions for semantic parsing on a large KB with a seq2seq PLM. The grammar defines actions as production rules, and our semantic parser predicts actions during inference under the constraints by types and candidate expressions. We apply the grammar to knowledge base question answering, where the constraints by candidate expressions assist a semantic parser to generate valid KB elements. In experiments on two benchmarks, KQA Pro and Overnight, the constraints by candidate expressions increased the accuracy of our semantic parser, whether it was trained with strong supervision or weak supervision. Our semantic parser achieved state-of-the-art accuracies on KQA Pro and Overnight, and its implementation is publicly available at https://github.com/daehwannam/candexpr-sp.git.
- Abstract(参考訳): 意味論的パーサーは自然言語を論理形式に変換し、知識ベース(KB)に基づいて評価して記述を生成する。
近年、シーケンシャル・ツー・シークエンス(seq2seq)事前訓練言語モデル(PLM)や大規模言語モデルを用いて、論理形式をトークンのシーケンスとして扱うセマンティック・パーサーが開発されている。
構文的および意味論的妥当性について、セマンティックパーサーは制約付き復号化を可能にする文法を使用する。
しかし、文法にはKBの情報を多用する能力がないが、論理形式には実体や関係といったKB要素の表現が含まれている。
本研究では,Seq2seq PLMを用いた大容量KB上でのセマンティック解析の候補式を付加した文法を提案する。
文法は、アクションを生産ルールとして定義し、セマンティックパーザは、型と候補式による制約の下での推論中にアクションを予測する。
この文法を知識ベース質問応答に適用し,候補表現による制約が意味解析に役立ち,有効なKB要素を生成する。
KQA ProとOvernightの2つのベンチマーク実験において、候補表現による制約は、強い監督と弱い監督によって訓練されたかに関わらず、セマンティックパーサーの精度を高めた。
我々のセマンティックパーサーはKQA ProとOvernightで最先端のアキュラシーを達成し、その実装はhttps://github.com/daehwannam/candexpr-sp.git.comで公開されています。
関連論文リスト
- Tokenization as Finite-State Transduction [24.19959327497118]
正規言語の全てのトークン化を効率的にエンコードできる有限状態フレームワークを導入する。
そのByte-Pairを示します。
Match(BPE)とMaxPiece(WordPiece)がこのフレームワークに適合する。
これの応用は、あるパターンにマッチするように言語モデルの出力を制約するガイド付き生成である。
論文 参考訳(メタデータ) (2024-10-21T07:10:07Z) - A General and Flexible Multi-concept Parsing Framework for Multilingual Semantic Matching [60.51839859852572]
我々は,テキストを多言語セマンティックマッチングのためのマルチコンセプトに分解し,NERモデルに依存するモデルからモデルを解放することを提案する。
英語データセットのQQPとMRPC、中国語データセットのMedical-SMについて包括的な実験を行った。
論文 参考訳(メタデータ) (2024-03-05T13:55:16Z) - From Parse-Execute to Parse-Execute-Refine: Improving Semantic Parser
for Complex Question Answering over Knowledge Base [11.72232145568396]
KoPLは、複雑なKBQAにおける最先端技術を達成するための推論プロセスを明示的にモデル化するために提案されている。
このような単純な戦略は複雑な推論の能力を大幅に向上させることができることを示す。
論文 参考訳(メタデータ) (2023-05-05T08:20:09Z) - Uni-Parser: Unified Semantic Parser for Question Answering on Knowledge
Base and Database [86.03294330305097]
知識ベース(KB)とデータベース(DB)の両方で質問応答(QA)を統一した意味的要素を提案する。
フレームワークに不可欠な要素としてプリミティブ(KBのリレーションとエンティティ、テーブル名、列名、DBのセル値)を導入します。
生成元を利用して、異なる操作でトップランクプリミティブを変更・構成することで、最終的な論理形式を予測する。
論文 参考訳(メタデータ) (2022-11-09T19:33:27Z) - TIARA: Multi-grained Retrieval for Robust Question Answering over Large
Knowledge Bases [20.751369684593985]
TIARAは、PLMやオラクルエンティティアノテーションなどを含む以前のSOTAよりも、GrailQAおよびWebQuestionsSP上の少なくとも4.1と1.1のF1ポイントが優れている。
論文 参考訳(メタデータ) (2022-10-24T02:41:10Z) - BenchCLAMP: A Benchmark for Evaluating Language Models on Syntactic and
Semantic Parsing [55.058258437125524]
本稿では,制約付きLanguage Model Parsingを評価するベンチマークであるBenchCLAMPを紹介する。
APIを通じてのみ利用可能な2つのGPT-3変種を含む8つの言語モデルをベンチマークする。
実験により,エンコーダ-デコーダ事前学習言語モデルでは,モデル出力が有効であると制約された場合に,構文解析や意味解析の最先端手法を超えることができることがわかった。
論文 参考訳(メタデータ) (2022-06-21T18:34:11Z) - Few-Shot Semantic Parsing with Language Models Trained On Code [52.23355024995237]
Codexは同等のGPT-3モデルよりもセマンティックパーシングが優れていることがわかった。
GPT-3とは異なり、Codexは意味表現を直接ターゲットとする場合、おそらく意味解析で使われる意味表現がコードと似た構造になっているように、同じように機能する。
論文 参考訳(メタデータ) (2021-12-16T08:34:06Z) - On The Ingredients of an Effective Zero-shot Semantic Parser [95.01623036661468]
我々は、標準発話とプログラムの訓練例を文法から言い換えて、ゼロショット学習を分析する。
改良された文法,より強力なパラフレーズ,効率的な学習手法を用いて,これらのギャップを埋めることを提案する。
我々のモデルはラベル付きデータゼロの2つの意味解析ベンチマーク(Scholar, Geo)で高い性能を達成する。
論文 参考訳(メタデータ) (2021-10-15T21:41:16Z) - The Limitations of Limited Context for Constituency Parsing [27.271792317099045]
Shen et al., 2018a)の構文解析アーキテクチャは、教師なし構文解析を最初に行った。
現在の構文に対するニューラルアプローチはどのような構文構造を表現できるのか?
我々は確率論的自由文法(PCFG)のサンドボックスにこの疑問を解いた。
これらのアプローチの表現力の重要な側面は、予測者がアクセス可能なコンテキストの量と方向性である。
論文 参考訳(メタデータ) (2021-06-03T03:58:35Z) - Infusing Finetuning with Semantic Dependencies [62.37697048781823]
シンタックスとは異なり、セマンティクスは今日の事前訓練モデルによって表面化されないことを示す。
次に、畳み込みグラフエンコーダを使用して、タスク固有の微調整にセマンティック解析を明示的に組み込む。
論文 参考訳(メタデータ) (2020-12-10T01:27:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。