論文の概要: KG20C & KG20C-QA: Scholarly Knowledge Graph Benchmarks for Link Prediction and Question Answering
- arxiv url: http://arxiv.org/abs/2512.21799v1
- Date: Thu, 25 Dec 2025 22:29:54 GMT
- ステータス: 情報取得中
- システム内更新日: 2025-12-29 11:51:39.193316
- Title: KG20C & KG20C-QA: Scholarly Knowledge Graph Benchmarks for Link Prediction and Question Answering
- Title(参考訳): KG20CとKG20C-QA: リンク予測と質問応答のための学術知識グラフベンチマーク
- Authors: Hung-Nghiep Tran, Atsuhiro Takasu,
- Abstract要約: KG20CはMicrosoft Academic Graphから構築された高品質な学術知識グラフである。
KG20C-QAは、学術データに対するQAタスクをサポートするためにKG20C上に構築されている。
- 参考スコア(独自算出の注目度): 3.8315541579168353
- License:
- Abstract: In this paper, we present KG20C and KG20C-QA, two curated datasets for advancing question answering (QA) research on scholarly data. KG20C is a high-quality scholarly knowledge graph constructed from the Microsoft Academic Graph through targeted selection of venues, quality-based filtering, and schema definition. Although KG20C has been available online in non-peer-reviewed sources such as GitHub repository, this paper provides the first formal, peer-reviewed description of the dataset, including clear documentation of its construction and specifications. KG20C-QA is built upon KG20C to support QA tasks on scholarly data. We define a set of QA templates that convert graph triples into natural language question--answer pairs, producing a benchmark that can be used both with graph-based models such as knowledge graph embeddings and with text-based models such as large language models. We benchmark standard knowledge graph embedding methods on KG20C-QA, analyze performance across relation types, and provide reproducible evaluation protocols. By officially releasing these datasets with thorough documentation, we aim to contribute a reusable, extensible resource for the research community, enabling future work in QA, reasoning, and knowledge-driven applications in the scholarly domain. The full datasets will be released at https://github.com/tranhungnghiep/KG20C/ upon paper publication.
- Abstract(参考訳): 本稿では、学術データに対する質問応答(QA)研究を進めるための2つのキュレートデータセットであるKG20CとKG20C-QAについて述べる。
KG20Cは、Microsoft Academic Graphから構築された高品質な知識グラフで、会場の選択、品質ベースのフィルタリング、スキーマ定義をターゲットとしている。
KG20Cは、GitHubリポジトリのようなピアレビューされていないソースでオンラインで公開されているが、この論文は、その構築と仕様の明確なドキュメントを含む、データセットの最初の正式なピアレビュー記述を提供する。
KG20C-QAは、学術データに対するQAタスクをサポートするためにKG20C上に構築されている。
グラフトリプルを自然言語の質問対に変換するQAテンプレートのセットを定義し,知識グラフ埋め込みなどのグラフベースモデルと,大規模言語モデルのようなテキストベースモデルの両方で使用可能なベンチマークを作成する。
我々は、KG20C-QA上の標準知識グラフ埋め込み手法をベンチマークし、関係型間での性能を分析し、再現可能な評価プロトコルを提供する。
これらのデータセットを詳細なドキュメンテーションで正式にリリースすることで、研究コミュニティに再利用可能な拡張可能なリソースを提供し、今後のQA、推論、そして学術領域における知識駆動の応用を可能にすることを目指しています。
完全なデータセットは、論文公開時にhttps://github.com/tranhunghiep/KG20Cで公開される。
関連論文リスト
- Can Knowledge-Graph-based Retrieval Augmented Generation Really Retrieve What You Need? [57.28763506780752]
GraphFlowは、テキストリッチなKGから現実世界のクエリに必要な正確で多様な知識を効率的に取得するフレームワークである。
GPT-4oを含む強力なKG-RAGベースラインを10%上回り、ヒット率とリコール率で上回る。
また、KGを見えないものに強く一般化し、その有効性と堅牢性を示す。
論文 参考訳(メタデータ) (2025-10-18T17:06:49Z) - Structural Alignment in Link Prediction [0.0]
この論文は、KGデータモデリングとリンク予測に対するフィールドのアプローチに関する別の視点を提案する。
この研究は、グラフ構造第一の観点からKGと最先端リンク予測器を再解析する。
論文 参考訳(メタデータ) (2025-05-08T04:27:15Z) - PeerQA: A Scientific Question Answering Dataset from Peer Reviews [51.95579001315713]
実世界の科学的、文書レベルの質問回答データセットであるPeerQAを提示する。
データセットには208の学術論文から579のQAペアが含まれており、MLとNLPが多数を占めている。
収集したデータセットを詳細に分析し、3つのタスクのベースラインシステムを確立する実験を行う。
論文 参考訳(メタデータ) (2025-02-19T12:24:46Z) - KGxBoard: Explainable and Interactive Leaderboard for Evaluation of
Knowledge Graph Completion Models [76.01814380927507]
KGxBoardは、データの意味のあるサブセットを詳細に評価するためのインタラクティブなフレームワークである。
実験では,KGxBoardを用いることで,標準平均シングルスコアメトリクスでは検出が不可能であったことを強調した。
論文 参考訳(メタデータ) (2022-08-23T15:11:45Z) - Knowledge Graph Question Answering Datasets and Their Generalizability:
Are They Enough for Future Research? [0.7817685358710509]
5つの異なる知識グラフ(KGs)のためのよく知られたKGQAデータセット25の解析
この定義によれば、既存のオンラインKGQAデータセットの多くは、一般化可能なKGQAシステムのトレーニングには適していないか、あるいは、データセットが廃止および時代遅れのKGに基づいていることが示されている。
本稿では,利用可能なKGQAデータセットを再分割し,コストや手作業を伴わずに一般化を評価するための緩和手法を提案する。
論文 参考訳(メタデータ) (2022-05-13T12:01:15Z) - Knowledge Graph Question Answering Leaderboard: A Community Resource to
Prevent a Replication Crisis [61.740077541531726]
コミュニティの焦点として、KGQAベンチマークデータセットに対して、新たな中心的でオープンなリーダボードを提供しています。
本分析は,KGQAシステムの評価において,既存の問題点を浮き彫りにする。
論文 参考訳(メタデータ) (2022-01-20T13:46:01Z) - Toward Subgraph-Guided Knowledge Graph Question Generation with Graph
Neural Networks [53.58077686470096]
知識グラフ(KG)質問生成(QG)は,KGから自然言語質問を生成することを目的とする。
本研究は,KGサブグラフから質問を生成し,回答をターゲットとする,より現実的な環境に焦点を当てる。
論文 参考訳(メタデータ) (2020-04-13T15:43:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。