論文の概要: Evaluating Knowledge Graph Complexity via Semantic, Spectral, and Structural Metrics for Link Prediction
- arxiv url: http://arxiv.org/abs/2508.15291v1
- Date: Thu, 21 Aug 2025 06:27:20 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-22 16:26:46.210103
- Title: Evaluating Knowledge Graph Complexity via Semantic, Spectral, and Structural Metrics for Link Prediction
- Title(参考訳): リンク予測のための意味・スペクトル・構造指標による知識グラフ複雑度の評価
- Authors: Haji Gul, Abul Ghani Naim, Ajaz Ahmad Bhat,
- Abstract要約: 構造的およびセマンティックなKG複雑性メトリクスのセットを導入し、ベンチマークする。
CSGはパラメトリゼーションに非常に敏感であり,クラス数に強く対応していない。
CSGは,リンク予測設定において,安定性と一般化予測能力が保たないことを実証した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Understanding dataset complexity is fundamental to evaluating and comparing link prediction models on knowledge graphs (KGs). While the Cumulative Spectral Gradient (CSG) metric, derived from probabilistic divergence between classes within a spectral clustering framework, has been proposed as a classifier agnostic complexity metric purportedly scaling with class cardinality and correlating with downstream performance, it has not been evaluated in KG settings so far. In this work, we critically examine CSG in the context of multi relational link prediction, incorporating semantic representations via transformer derived embeddings. Contrary to prior claims, we find that CSG is highly sensitive to parametrisation and does not robustly scale with the number of classes. Moreover, it exhibits weak or inconsistent correlation with standard performance metrics such as Mean Reciprocal Rank (MRR) and Hit@1. To deepen the analysis, we introduce and benchmark a set of structural and semantic KG complexity metrics. Our findings reveal that global and local relational ambiguity captured via Relation Entropy, node level Maximum Relation Diversity, and Relation Type Cardinality exhibit strong inverse correlations with MRR and Hit@1, suggesting these as more faithful indicators of task difficulty. Conversely, graph connectivity measures such as Average Degree, Degree Entropy, PageRank, and Eigenvector Centrality correlate positively with Hit@10. Our results demonstrate that CSGs purported stability and generalization predictive power fail to hold in link prediction settings and underscore the need for more stable, interpretable, and task-aligned measures of dataset complexity in knowledge driven learning.
- Abstract(参考訳): データセットの複雑さを理解することは、知識グラフ(KG)上のリンク予測モデルの評価と比較に不可欠である。
スペクトルクラスタリングフレームワーク内のクラス間の確率的ばらつきから導かれる累積スペクトル勾配(CSG)計量は、クラス濃度に比例してスケールし、下流のパフォーマンスに相関する分類器非依存の複雑性計量として提案されているが、KG設定では評価されていない。
本研究では,マルチリレーショナルリンク予測の文脈におけるCSGを批判的に検討し,トランスフォーマ由来の埋め込みによる意味表現を取り入れた。
従来の主張とは対照的に、CSGはパラメトリゼーションに非常に敏感であり、クラス数に頑健にスケールしない。
さらに、Mean Reciprocal Rank(MRR)やHit@1といった、標準的なパフォーマンス指標と弱いあるいは矛盾した相関を示す。
分析をより深めるために、構造的および意味的KG複雑性メトリクスのセットを導入し、ベンチマークする。
以上の結果から,関係エントロピー,ノードレベルの最大関係多様性,関係型心性はMRRやHit@1と強い逆相関を示し,課題難易度をより忠実に表す指標として示唆された。
逆に、平均Degree、Degree Entropy、PageRank、Eigenvector Centralityといったグラフ接続対策はHit@10と正に相関している。
以上の結果から,CSGは,知識駆動学習におけるデータセットの複雑性の安定性と一般化予測能力がリンク予測設定に保たないことを示唆し,より安定的で解釈可能なタスク整合性尺度の必要性を浮き彫りにしている。
関連論文リスト
- Structural Connectome Harmonization Using Deep Learning: The Strength of Graph Neural Networks [0.9663199711697325]
構造コネクトーム(SC)研究における小さなサンプルサイズは、神経学的および精神疾患に対する信頼性の高いバイオマーカーの開発を制限する。
大規模なマルチサイト研究は存在するが、スキャナーの不均一性による買収関連バイアスがある。
本稿では,メタデータを必要とせず,多様な取得サイト間でSCを調和させる,サイト条件の深い調和フレームワークを提案する。
論文 参考訳(メタデータ) (2025-07-18T14:58:05Z) - Information-theoretic Quantification of High-order Feature Effects in Classification Problems [0.19791587637442676]
特徴重要度(Hi-Fi)法における高次相互作用の情報理論拡張について述べる。
私たちのフレームワークは、機能のコントリビューションをユニークでシナジスティックで冗長なコンポーネントに分解します。
その結果,提案した推定器は理論的および予測された結果を正確に復元することがわかった。
論文 参考訳(メタデータ) (2025-07-06T11:50:30Z) - Hallucination Detection in LLMs with Topological Divergence on Attention Graphs [64.74977204942199]
幻覚(Halucination)、すなわち、事実的に誤ったコンテンツを生成することは、大きな言語モデルにとって重要な課題である。
本稿では,TOHA (Topology-based HAllucination detector) をRAG設定に導入する。
論文 参考訳(メタデータ) (2025-04-14T10:06:27Z) - Spuriousness-Aware Meta-Learning for Learning Robust Classifiers [26.544938760265136]
Spurious correlations is brittle associations between certain attribute of inputs and target variables。
深部画像分類器はしばしばそれらを予測に利用し、相関が持たないデータの一般化が不十分になる。
スプリアス相関の影響を緩和することはロバストなモデル一般化に不可欠であるが、しばしばデータ内のスプリアス相関のアノテーションを必要とする。
論文 参考訳(メタデータ) (2024-06-15T21:41:25Z) - Federated Contrastive Learning for Personalized Semantic Communication [55.46383524190467]
我々は,パーソナライズされたセマンティックコミュニケーションを支援することを目的とした,協調型コントラスト学習フレームワークを設計する。
FedCLは、複数のクライアントにわたるローカルセマンティックエンコーダと、基地局が所有するグローバルセマンティックデコーダの協調トレーニングを可能にする。
分散クライアント間の異種データセットから生じるセマンティック不均衡問題に対処するために,コントラスト学習を用いてセマンティックセントロイドジェネレータを訓練する。
論文 参考訳(メタデータ) (2024-06-13T14:45:35Z) - Variable Importance in High-Dimensional Settings Requires Grouping [19.095605415846187]
Conditional Permutation Importance (CPI)は、そのような場合のPIの制限をバイパスする。
クラスタリングまたはいくつかの事前知識を介して統計的に変数をグループ化すると、ある程度のパワーバックが得られる。
重み付けにより拡張された手法は,高相関なグループであっても,型Iエラーを制御可能であることを示す。
論文 参考訳(メタデータ) (2023-12-18T00:21:47Z) - Understanding Augmentation-based Self-Supervised Representation Learning
via RKHS Approximation and Regression [53.15502562048627]
最近の研究は、自己教師付き学習とグラフラプラシアン作用素のトップ固有空間の近似との関係を構築している。
この研究は、増強に基づく事前訓練の統計的分析に発展する。
論文 参考訳(メタデータ) (2023-06-01T15:18:55Z) - Simple and Scalable Algorithms for Cluster-Aware Precision Medicine [0.0]
共同クラスタリングと埋め込みに対するシンプルでスケーラブルなアプローチを提案する。
この新しいクラスタ対応の埋め込みアプローチは、現在の共同埋め込みとクラスタリング法の複雑さと限界を克服する。
当社のアプローチでは,ユーザが希望するクラスタ数を選択する必要はなく,階層的にクラスタ化された埋め込みの解釈可能なデンドログラムを生成する。
論文 参考訳(メタデータ) (2022-11-29T19:27:26Z) - ER: Equivariance Regularizer for Knowledge Graph Completion [107.51609402963072]
我々は、新しい正規化器、すなわち等分散正規化器(ER)を提案する。
ERは、頭と尾のエンティティ間の意味的等価性を利用することで、モデルの一般化能力を高めることができる。
実験結果から,最先端関係予測法よりも明確かつ実質的な改善が示された。
論文 参考訳(メタデータ) (2022-06-24T08:18:05Z) - Accuracy on the Line: On the Strong Correlation Between
Out-of-Distribution and In-Distribution Generalization [89.73665256847858]
分布外性能は,広範囲なモデルと分布シフトに対する分布内性能と強く相関していることを示す。
具体的には,CIFAR-10 と ImageNet の変種に対する分布内分布と分布外分布性能の強い相関関係を示す。
また,CIFAR-10-Cと組織分類データセットCamelyon17-WILDSの合成分布の変化など,相関が弱いケースについても検討した。
論文 参考訳(メタデータ) (2021-07-09T19:48:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。