論文の概要: BigCQ: A large-scale synthetic dataset of competency question patterns
formalized into SPARQL-OWL query templates
- arxiv url: http://arxiv.org/abs/2105.09574v1
- Date: Thu, 20 May 2021 07:59:59 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-21 13:37:36.111907
- Title: BigCQ: A large-scale synthetic dataset of competency question patterns
formalized into SPARQL-OWL query templates
- Title(参考訳): BigCQ: SPARQL-OWLクエリテンプレートに形式化された有能な質問パターンの大規模合成データセット
- Authors: Dawid Wi\'sniewski and J\k{e}drzej Potoniec and Agnieszka
{\L}awrynowicz
- Abstract要約: BigCQは、SPARQL-OWLクエリテンプレートへのフォーマル化を備えた、CQテンプレートの最大のデータセットである。
データセットを詳細に記述し、データセットの作成に繋がるプロセスの説明と、データセットが実際の例をどのようにカバーしているかを分析する。
- 参考スコア(独自算出の注目度): 0.06445605125467574
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Competency Questions (CQs) are used in many ontology engineering
methodologies to collect requirements and track the completeness and
correctness of an ontology being constructed. Although they are frequently
suggested by ontology engineering methodologies, the publicly available
datasets of CQs and their formalizations in ontology query languages are very
scarce. Since first efforts to automate processes utilizing CQs are being made,
it is of high importance to provide large and diverse datasets to fuel these
solutions. In this paper, we present BigCQ, the biggest dataset of CQ templates
with their formalizations into SPARQL-OWL query templates. BigCQ is created
automatically from a dataset of frequently used axiom shapes. These pairs of CQ
templates and query templates can be then materialized as actual CQs and
SPARQL-OWL queries if filled with resource labels and IRIs from a given
ontology. We describe the dataset in detail, provide a description of the
process leading to the creation of the dataset and analyze how well the dataset
covers real-world examples. We also publish the dataset as well as scripts
transforming axiom shapes into pairs of CQ patterns and SPARQL-OWL templates,
to make engineers able to adapt the process to their particular needs.
- Abstract(参考訳): コンピテンシー質問 (CQ) は、多くのオントロジー工学手法において、要求を収集し、構築中のオントロジーの完全性と正確性を追跡するために用いられる。
オントロジー工学手法によってしばしば提案されるが、CQの公開データセットとオントロジークエリ言語での形式化は非常に少ない。
CQを利用したプロセスを自動化するための最初の取り組みが作成されているため、これらのソリューションを促進するために、大規模で多様なデータセットを提供することが重要である。
本稿では,CQテンプレートの最大データセットであるBigCQをSPARQL-OWLクエリテンプレートに形式化する。
BigCQは頻繁に使用される公理形状のデータセットから自動的に生成される。
これらのCQテンプレートとクエリテンプレートのペアは、与えられたオントロジーのリソースラベルとIRIで満たされた場合、実際のCQとSPARQL-OWLクエリとして実現される。
データセットを詳細に記述し、データセットの作成に繋がるプロセスの説明と、データセットが実際の例をどのようにカバーしているかを分析する。
また、データセットと公理形をcqパターンとsparql-owlテンプレートのペアに変換するスクリプトを公開して、エンジニアが特定のニーズにプロセスを適応できるようにしています。
関連論文リスト
- Automatic Question-Answer Generation for Long-Tail Knowledge [65.11554185687258]
テールエンティティのための特別なQAデータセットを生成するための自動アプローチを提案する。
我々は,新たに生成された長尾QAデータセットに事前学習したLLMを用いて広範な実験を行う。
論文 参考訳(メタデータ) (2024-03-03T03:06:31Z) - In-Context Learning for Knowledge Base Question Answering for Unmanned
Systems based on Large Language Models [43.642717344626355]
我々は,無人システムにおける知識グラフ推論を用いた質問回答コンペティション(CCKS2023)に注目した。
多くのQAタスクにおいてChatGPTやGPT-3のような大規模言語モデル(LLM)が最近成功したことに触発されて、ChatGPTベースのCypher Query Language(CQL)生成フレームワークを提案する。
当社のChatGPTベースのCQL生成フレームワークは、Unmanned Systemsコンペティションのための知識グラフ推論によるCCKS 2023質問回答において、第2位を獲得しました。
論文 参考訳(メタデータ) (2023-11-06T08:52:11Z) - Prompting Large Language Models with Chain-of-Thought for Few-Shot
Knowledge Base Question Generation [19.327008532572645]
知識ベースに関する質問生成(KBQG)は、論理形式を自然言語の質問に変換することを目的としている。
推論のためのコンテキスト内学習戦略であるChain-of-Thoughtプロンプトを提案する。
3つのKBQGデータセットに対して広範な実験を行う。
論文 参考訳(メタデータ) (2023-10-12T15:08:14Z) - LMGQS: A Large-scale Dataset for Query-focused Summarization [77.6179359525065]
我々は4つの一般的な要約ベンチマークを新しいQFSベンチマークデータセットであるLMGQSに変換する。
我々は最先端の要約モデルを用いてベースラインを確立する。
複数の既存のQFSベンチマークにおいて、最先端のゼロショットと教師付きパフォーマンスを実現する。
論文 参考訳(メタデータ) (2023-05-22T14:53:45Z) - PAXQA: Generating Cross-lingual Question Answering Examples at Training
Scale [53.92008514395125]
PAXQA(クロスリンガル(x)QAのアノテーションの計画)は、クロスリンガルQAを2段階に分解する。
本稿では、並列ビットから制約されたエンティティを抽出する語彙制約機械翻訳の新たな利用法を提案する。
これらのデータセットに基づいて微調整されたモデルは、複数の抽出されたQAデータセット上で、先行合成データ生成モデルより優れていることを示す。
論文 参考訳(メタデータ) (2023-04-24T15:46:26Z) - NQE: N-ary Query Embedding for Complex Query Answering over
Hyper-Relational Knowledge Graphs [1.415350927301928]
複雑なクエリ応答は知識グラフの論理的推論に不可欠なタスクである。
ハイパーリレーショナル知識グラフ(HKG)上のCQAのための新しいN-ary Query Embedding (NQE)モデルを提案する。
NQEは二元変換器エンコーダとファジィ論理理論を用いて全てのn-ary FOLクエリを満たす。
我々は、WD50K上の多様なn-ary FOLクエリを含む、新しいCQAデータセットWD50K-NFOLを生成する。
論文 参考訳(メタデータ) (2022-11-24T08:26:18Z) - Knowledge Base Question Answering by Case-based Reasoning over Subgraphs [81.22050011503933]
本モデルでは,既存のKG補完アルゴリズムよりも複雑な推論パターンを必要とする問合せに対して,より効果的に答えることを示す。
提案モデルは、KBQAベンチマークの最先端モデルよりも優れているか、競合的に動作する。
論文 参考訳(メタデータ) (2022-02-22T01:34:35Z) - ArchivalQA: A Large-scale Benchmark Dataset for Open Domain Question
Answering over Archival News Collections [20.07130742712862]
本稿では,1067,056組の質問応答データセットArchivealQAを提案する。
課題の難易度と時間表現の包含に基づいて,データセットの4つの部分を作成する。
論文 参考訳(メタデータ) (2021-09-08T05:21:51Z) - Exploring Sequence-to-Sequence Models for SPARQL Pattern Composition [0.5639451539396457]
構造化され、構造化されていないデータとして、インターネットに爆発的な情報が追加され、DBpediaやWikidataのような知識ベースが供給される。
質問回答システムの目的は、正規のクエリを書くことなく、自然言語でそのようなデータにアクセスできるようにすることである。
我々は、長い発話を複雑なSPARQLクエリに変換するための、シーケンス・ツー・シーケンス・モデルが実現可能で有望な選択肢であることを示す。
論文 参考訳(メタデータ) (2020-10-21T11:12:01Z) - Generating Diverse and Consistent QA pairs from Contexts with
Information-Maximizing Hierarchical Conditional VAEs [62.71505254770827]
非構造化テキストを文脈として与えられたQAペアを生成するための条件付き変分オートエンコーダ(HCVAE)を提案する。
我々のモデルは、トレーニングにわずかなデータしか使わず、両方のタスクの全てのベースラインに対して印象的なパフォーマンス向上が得られる。
論文 参考訳(メタデータ) (2020-05-28T08:26:06Z) - Template-Based Question Generation from Retrieved Sentences for Improved
Unsupervised Question Answering [98.48363619128108]
擬似学習データを用いてQAモデルを訓練するための教師なしアプローチを提案する。
関連した検索文に簡単なテンプレートを適用してQA学習のための質問を生成すると、元の文脈文よりも、下流QAのパフォーマンスが向上することを示す。
論文 参考訳(メタデータ) (2020-04-24T17:57:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。