論文の概要: Understanding the Effect of Knowledge Graph Extraction Error on Downstream Graph Analyses: A Case Study on Affiliation Graphs
- arxiv url: http://arxiv.org/abs/2506.12367v1
- Date: Sat, 14 Jun 2025 06:14:06 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-17 17:28:45.990091
- Title: Understanding the Effect of Knowledge Graph Extraction Error on Downstream Graph Analyses: A Case Study on Affiliation Graphs
- Title(参考訳): 下流グラフ解析における知識グラフ抽出誤差の理解:アフィリエレーショングラフを事例として
- Authors: Erica Cai, Brendan O'Connor,
- Abstract要約: 知識グラフ(KG)は、社会構造、コミュニティダイナミクス、制度的メンバーシップ、その他の複雑な関係を分析するのに有用である。
大規模言語モデル(LLM)の最近の進歩は、大規模テキストコーパスから自動KG抽出のスケーラビリティとアクセシビリティを改善している。
下流分析における抽出誤差の影響はよく理解されていないが、特に実世界の洞察のために正確なKGに依存している応用科学者にとってはよく理解されていない。
- 参考スコア(独自算出の注目度): 4.818309069556584
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Knowledge graphs (KGs) are useful for analyzing social structures, community dynamics, institutional memberships, and other complex relationships across domains from sociology to public health. While recent advances in large language models (LLMs) have improved the scalability and accessibility of automated KG extraction from large text corpora, the impacts of extraction errors on downstream analyses are poorly understood, especially for applied scientists who depend on accurate KGs for real-world insights. To address this gap, we conducted the first evaluation of KG extraction performance at two levels: (1) micro-level edge accuracy, which is consistent with standard NLP evaluations, and manual identification of common error sources; (2) macro-level graph metrics that assess structural properties such as community detection and connectivity, which are relevant to real-world applications. Focusing on affiliation graphs of person membership in organizations extracted from social register books, our study identifies a range of extraction performance where biases across most downstream graph analysis metrics are near zero. However, as extraction performance declines, we find that many metrics exhibit increasingly pronounced biases, with each metric tending toward a consistent direction of either over- or under-estimation. Through simulations, we further show that error models commonly used in the literature do not capture these bias patterns, indicating the need for more realistic error models for KG extraction. Our findings provide actionable insights for practitioners and underscores the importance of advancing extraction methods and error modeling to ensure reliable and meaningful downstream analyses.
- Abstract(参考訳): 知識グラフ(KGs)は、社会構造、地域動態、制度的メンバーシップ、社会学から公衆衛生まで、ドメイン間の複雑な関係を分析するのに有用である。
近年の大規模言語モデル (LLM) の進歩により, 大規模テキストコーパスからの自動KG抽出のスケーラビリティとアクセシビリティが向上しているが, 下流分析における抽出誤差の影響はよく理解されていない。
そこで我々は,(1)標準NLP評価と整合したマイクロレベルのエッジ精度と,(2)コミュニティ検出やコネクティビティなどの構造特性を評価するマクロレベルのグラフメトリクスの2つのレベルにおいて,KG抽出性能の最初の評価を行った。
本研究は,社会登録書から抽出した組織における個人会員のアフィリエイトグラフに着目し,下流のグラフ分析指標の偏りがほぼゼロに近い範囲の抽出性能を明らかにした。
しかし、抽出性能が低下するにつれて、多くの指標が次第に顕著なバイアスを示し、各指標は過大評価または過小評価のいずれかの一貫した方向に向かう傾向にあることがわかった。
シミュレーションにより、文献で一般的に使われている誤りモデルがこれらのバイアスパターンを捉えていないことが示され、KG抽出のためのより現実的な誤りモデルの必要性が示唆された。
本研究は, 実践者に対して実用的な知見を提供し, 信頼性と意味のある下流分析を確実にするために, 抽出法と誤りモデリングを推進していくことの重要性を裏付けるものである。
関連論文リスト
- Relation Extraction Across Entire Books to Reconstruct Community Networks: The AffilKG Datasets [3.9244082434642555]
AffilKGは6つのデータセットの集合で、完全な書籍スキャンと大きなラベル付き知識グラフをペアにした最初のものである。
各データセットにはアフィリエイトグラフがあり、人と組織間のメンバ関係をキャプチャするシンプルなKGである。
論文 参考訳(メタデータ) (2025-05-16T02:24:32Z) - ADKGD: Anomaly Detection in Knowledge Graphs with Dual-Channel Training [38.3788247358102]
本稿では、二重チャネル学習(ADKGD)を用いた知識グラフにおける異常検出アルゴリズムを提案する。
両チャネル間のスコアリング関数の精度を向上させるために,KL(Kullback-leibler)-loss成分を導入する。
実験の結果,ADKGDは最先端の異常検出アルゴリズムよりも優れていた。
論文 参考訳(メタデータ) (2025-01-13T06:22:52Z) - KnowGraph: Knowledge-Enabled Anomaly Detection via Logical Reasoning on Graph Data [13.510494408303536]
KnowGraphは、グラフベースの異常検出を強化するために、ドメイン知識とデータ駆動学習を統合する。
テストでは、KnowGraphはトランスダクティブとインダクティブの両方で、最先端のベースラインを一貫して上回っている。
その結果は、高レベルのグラフベースのセキュリティアプリケーションのためのデータ駆動モデルにドメイン知識を統合する可能性を強調している。
論文 参考訳(メタデータ) (2024-10-10T21:53:33Z) - Mitigating Relational Bias on Knowledge Graphs [51.346018842327865]
マルチホップバイアスを同時に緩和し,知識グラフにおけるエンティティとリレーションの近接情報を保存するフレームワークであるFair-KGNNを提案する。
ジェンダー占有とナショナリティ・サリーバイアスを軽減するために,2つの最先端KGNNモデル(RCCNとCompGCN)を組み込んだFair-KGNNの2例を開発した。
論文 参考訳(メタデータ) (2022-11-26T05:55:34Z) - A Graph-Enhanced Click Model for Web Search [67.27218481132185]
ウェブ検索のための新しいグラフ強調クリックモデル(GraphCM)を提案する。
セッション内情報とセッション間情報の両方を、スパーシリティ問題とコールドスタート問題に活用する。
論文 参考訳(メタデータ) (2022-06-17T08:32:43Z) - How Knowledge Graph and Attention Help? A Quantitative Analysis into
Bag-level Relation Extraction [66.09605613944201]
バッグレベルの関係抽出(RE)における注意と知識グラフの効果を定量的に評価する。
その結果,(1)注目精度の向上は,エンティティ参照特徴を抽出するモデルの性能を損なう可能性があること,(2)注目性能は様々なノイズ分布パターンの影響が大きいこと,(3)KG強化された注目はRE性能を向上するが,その効果は注目度を向上させるだけでなく,先行するエンティティを組み込むことによっても改善することがわかった。
論文 参考訳(メタデータ) (2021-07-26T09:38:28Z) - Model-Agnostic Graph Regularization for Few-Shot Learning [60.64531995451357]
グラフ組み込み数ショット学習に関する包括的な研究を紹介します。
本稿では,ラベル間のグラフ情報の組み込みによる影響をより深く理解できるグラフ正規化手法を提案する。
提案手法は,Mini-ImageNetで最大2%,ImageNet-FSで6.7%の性能向上を実現する。
論文 参考訳(メタデータ) (2021-02-14T05:28:13Z) - RelWalk A Latent Variable Model Approach to Knowledge Graph Embedding [50.010601631982425]
本稿では,単語埋め込みのランダムウォークモデル(Arora et al., 2016a)を知識グラフ埋め込み(KGE)に拡張する。
二つの実体 h (head) と t (tail) の間の関係 R の強さを評価するスコア関数を導出する。
理論的解析によって動機付けられた学習目標を提案し,知識グラフからKGEを学習する。
論文 参考訳(メタデータ) (2021-01-25T13:31:29Z) - Graph Representation Learning via Graphical Mutual Information
Maximization [86.32278001019854]
本稿では,入力グラフとハイレベルな隠蔽表現との相関を測る新しい概念であるGMIを提案する。
我々は,グラフニューラルエンコーダの入力と出力の間でGMIを最大化することで訓練された教師なし学習モデルを開発する。
論文 参考訳(メタデータ) (2020-02-04T08:33:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。