論文の概要: COREKG: Coreset-Guided Personalized Summarization of Knowledge Graphs
- arxiv url: http://arxiv.org/abs/2605.14900v1
- Date: Thu, 14 May 2026 14:40:05 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-15 21:45:34.882985
- Title: COREKG: Coreset-Guided Personalized Summarization of Knowledge Graphs
- Title(参考訳): COREKG:知識グラフのコアセットガイドによるパーソナライズ
- Authors: Sohel Aman Khan, Raghava Mutharaju, Supratim Shit,
- Abstract要約: 感度重要度サンプリングを用いて三重項の関連部分集合をサンプリングする手法を提案する。
クエリの振る舞いに基づいて,ユーザ毎の要約を構築することで,パーソナライズされた知識グラフの要約に着目する。
Freebase, WikiData, DBpedia による評価の結果, COREKG は最先端の手法よりも高い問合せ精度と構造的カバレッジを提供することがわかった。
- 参考スコア(独自算出の注目度): 2.8292841621378844
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Knowledge Graphs (KGs) are extensively used across different domains and in several applications. Often, these KGs are very large in size. Such KGs become unwieldy for tasks such as question answering and visualization. Summarization of KGs offers a viable alternative in such cases. Furthermore, personalized KG summarization is crucial in the current data-driven world as it captures the specific requirements of users based on their query patterns. Since it only maintains relevant information, the personalized summaries of KG are small, resulting in significantly smaller storage requirements and query runtime. In this work, we adapt the coreset theory to create personalized KG summaries. For a given dataset and a user-specific query workload, we present an approach that samples a relevant subset of triples using sensitivity-based importance sampling. We ensure that the subset approximates the characteristics of the full dataset with bounded approximation error. We define sensitivity scores that measure the importance of a triple with respect to a user's query workload, which are then used by our coreset construction algorithm. We explicitly focus on personalized knowledge graph summarization by constructing summaries independently for each user based on their query behaviour. Our evaluation on Freebase, WikiData, and DBpedia shows that COREKG delivers higher query-answering accuracy and structural coverage than the state-of-the-art methods, such as GLIMPSE, PPR, iSummary, PEGASUS and APEX$^2$ while requiring only a tiny fraction of the original graph.
- Abstract(参考訳): 知識グラフ(KG)は様々なドメインやいくつかのアプリケーションで広く使われている。
これらのKGは、しばしば非常に大きなサイズである。
このようなKGは質問応答や可視化といったタスクでは扱いにくいものになっている。
KGs の要約はそのような場合に実行可能な代替手段を提供する。
さらに、パーソナライズされたKG要約は、現在のデータ駆動の世界において重要であり、クエリパターンに基づいてユーザの特定の要求をキャプチャする。
関連する情報のみを保持するため、KGのパーソナライズされた要約は小さくなり、ストレージ要件とクエリランタイムが大幅に小さくなる。
本研究では,コアセット理論を適用して,個別化されたKG要約を生成する。
与えられたデータセットとユーザ固有のクエリワークロードに対して、感度に基づく重要度サンプリングを用いてトリプルの関連するサブセットをサンプリングするアプローチを提案する。
我々は、その部分集合が有界近似誤差で全データセットの特性に近似することを保証する。
我々は,ユーザのクエリ処理量に対して三重項の重要性を測定する感度スコアを定義し,コアセット構築アルゴリズムで使用する。
クエリの振る舞いに基づいて,ユーザ毎に個別に要約を構築することで,パーソナライズされた知識グラフの要約に着目する。
Freebase, WikiData, DBpedia での評価では, COREKG は GLIMPSE, PPR, iSummary, PEGASUS, APEX$^2$ といった最先端の手法よりもクエリ答えの精度と構造的カバレッジを向上し, 元のグラフのごく一部しか必要としない。
関連論文リスト
- Can Knowledge-Graph-based Retrieval Augmented Generation Really Retrieve What You Need? [57.28763506780752]
GraphFlowは、テキストリッチなKGから現実世界のクエリに必要な正確で多様な知識を効率的に取得するフレームワークである。
GPT-4oを含む強力なKG-RAGベースラインを10%上回り、ヒット率とリコール率で上回る。
また、KGを見えないものに強く一般化し、その有効性と堅牢性を示す。
論文 参考訳(メタデータ) (2025-10-18T17:06:49Z) - APEX$^2$: Adaptive and Extreme Summarization for Personalized Knowledge Graphs [47.289074913035314]
本稿では,高スケーラブルなPKG要約フレームワークであるAPEX$2$を提案する。
我々は、最大で1200万トリプルのベンチマークKGに対して、進化するクエリ設定の下でAPEX$2$を評価した。
実験の結果,APEXは問合せ精度と効率の両面で最先端のベースラインを上回っていることがわかった。
論文 参考訳(メタデータ) (2024-12-23T07:02:06Z) - A Prompt-Based Knowledge Graph Foundation Model for Universal In-Context Reasoning [17.676185326247946]
そこで本研究では,テキスト内学習,すなわちKG-ICLを介し,プロンプトに基づくKGファウンデーションモデルを提案する。
クエリにおけるエンティティや関係を発見できないような一般化機能を備えたプロンプトグラフを符号化するために,まず統一トークン化器を提案する。
そこで我々は,プロンプトエンコーディングとKG推論を行う2つのメッセージパッシングニューラルネットワークを提案する。
論文 参考訳(メタデータ) (2024-10-16T06:47:18Z) - Multi-hop Question Answering over Knowledge Graphs using Large Language Models [1.8130068086063336]
複数のホップを含む知識グラフに答える能力(LLM)を評価する。
我々は、KGのサイズや性質によって、関連する情報をLLMに抽出し、供給するために異なるアプローチが必要であることを示す。
論文 参考訳(メタデータ) (2024-04-30T03:31:03Z) - Learning Federated Neural Graph Databases for Answering Complex Queries from Distributed Knowledge Graphs [53.03085605769093]
我々は、マルチソースグラフデータに対するプライバシ保護推論を促進する先駆的な体系的フレームワークであるFederated Neural Graph DataBase(FedNGDB)を学習することを提案する。
FedNGDBは、フェデレートされた学習を活用して、複数のソースにわたるグラフ表現を協調的に学習し、エンティティ間の関係を強化し、グラフデータの全体的な品質を改善する。
論文 参考訳(メタデータ) (2024-02-22T14:57:44Z) - KGxBoard: Explainable and Interactive Leaderboard for Evaluation of
Knowledge Graph Completion Models [76.01814380927507]
KGxBoardは、データの意味のあるサブセットを詳細に評価するためのインタラクティブなフレームワークである。
実験では,KGxBoardを用いることで,標準平均シングルスコアメトリクスでは検出が不可能であったことを強調した。
論文 参考訳(メタデータ) (2022-08-23T15:11:45Z) - MEKER: Memory Efficient Knowledge Embedding Representation for Link
Prediction and Question Answering [65.62309538202771]
知識グラフ(KG)は、事実を象徴的に構造化した記憶装置である。
KG埋め込みには、実世界の暗黙的な情報を必要とするNLPタスクで使用される簡潔なデータが含まれている。
リンク予測タスクとKGに基づく質問応答においてSOTAに比較可能な性能をもたらすメモリ効率のよいKG埋め込みモデルを提案する。
論文 参考訳(メタデータ) (2022-04-22T10:47:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。