論文の概要: Walk Extraction Strategies for Node Embeddings with RDF2Vec in Knowledge
Graphs
- arxiv url: http://arxiv.org/abs/2009.04404v1
- Date: Wed, 9 Sep 2020 16:26:31 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-20 08:38:47.956957
- Title: Walk Extraction Strategies for Node Embeddings with RDF2Vec in Knowledge
Graphs
- Title(参考訳): 知識グラフにおけるrdf2vecを用いたノード埋め込みのウォーク抽出戦略
- Authors: Gilles Vandewiele, Bram Steenwinckel, Pieter Bonte, Michael Weyns,
Heiko Paulheim, Petar Ristoski, Filip De Turck, Femke Ongenae
- Abstract要約: RDF2Vecは、KG内のノードのタスクに依存しない数値表現を作成することができる教師なしの手法である。
WLカーネルは単一のKGのコンテキストにおける歩行埋め込みを改善するのにはほとんど役に立たないことを示す。
本稿では,基本的なランダムウォークと相補的な情報を抽出する5つの戦略を提案する。
- 参考スコア(独自算出の注目度): 7.380335699474426
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: As KGs are symbolic constructs, specialized techniques have to be applied in
order to make them compatible with data mining techniques. RDF2Vec is an
unsupervised technique that can create task-agnostic numerical representations
of the nodes in a KG by extending successful language modelling techniques. The
original work proposed the Weisfeiler-Lehman (WL) kernel to improve the quality
of the representations. However, in this work, we show both formally and
empirically that the WL kernel does little to improve walk embeddings in the
context of a single KG. As an alternative to the WL kernel, we propose five
different strategies to extract information complementary to basic random
walks. We compare these walks on several benchmark datasets to show that the
\emph{n-gram} strategy performs best on average on node classification tasks
and that tuning the walk strategy can result in improved predictive
performances.
- Abstract(参考訳): KGはシンボリックな構造であるため、データマイニング技術と互換性を持たせるために特殊な技術を適用する必要がある。
RDF2Vecは、言語モデリング技術の拡張により、KG内のノードのタスクに依存しない数値表現を作成することができる教師なしの手法である。
オリジナルの研究は、表現の質を改善するためにWeisfeiler-Lehman (WL)カーネルを提案した。
しかし,本研究では,WLカーネルが単一KGの文脈における歩行埋め込みを改善するのにはほとんど役に立たないことを示す。
WLカーネルの代替として、基本的なランダムウォークに補完する情報を抽出する5つの異なる戦略を提案する。
いくつかのベンチマークデータセット上でこれらのウォークを比較して,ノード分類タスクの平均値において, \emph{n-gram} 戦略が最善であることを示す。
関連論文リスト
- Language Models are Graph Learners [70.14063765424012]
言語モデル(LM)は、グラフニューラルネットワーク(GNN)やグラフトランスフォーマー(GT)など、ドメイン固有のモデルの優位性に挑戦している。
本稿では,ノード分類タスクにおける最先端のGNNに匹敵する性能を実現するために,既製のLMを有効活用する手法を提案する。
論文 参考訳(メタデータ) (2024-10-03T08:27:54Z) - Enhanced Expressivity in Graph Neural Networks with Lanczos-Based Linear Constraints [7.605749412696919]
グラフニューラルネットワーク(GNN)はグラフ構造化データの処理に優れるが、リンク予測タスクでは性能が劣ることが多い。
グラフラプラシア行列の固有基底に誘導された部分グラフを埋め込むことによりGNNの表現性を高める新しい手法を提案する。
提案手法は,PubMedとOGBL-Vesselのデータセットから,5%と10%のデータしか必要とせず,20倍と10倍の高速化を実現する。
論文 参考訳(メタデータ) (2024-08-22T12:22:00Z) - Parameter-Efficient Tuning Large Language Models for Graph Representation Learning [62.26278815157628]
Graph-awareを導入します。
GPEFT - グラフ表現学習のための新しい手法。
グラフニューラルネットワーク(GNN)を用いて、隣接するノードからグラフプロンプトに構造情報をエンコードする。
我々は8つの異なるテキストリッチグラフで実施した総合的な実験を通じて,リンク予測評価において hit@1 と Mean Reciprocal Rank (MRR) の平均 2% の改善を観察し,本手法の有効性を検証した。
論文 参考訳(メタデータ) (2024-04-28T18:36:59Z) - Task-Oriented GNNs Training on Large Knowledge Graphs for Accurate and Efficient Modeling [5.460112864687281]
本稿では,大規模知識グラフ(KG)を用いたタスク指向HGNN学習におけるTOSG抽出の自動化手法であるKG-TOSAを提案する。
KG-TOSAは、最新のHGNN手法により、トレーニング時間とメモリ使用量を最大70%削減し、精度や推論時間などのモデル性能を向上させる。
論文 参考訳(メタデータ) (2024-03-09T01:17:26Z) - Contextualization Distillation from Large Language Model for Knowledge
Graph Completion [51.126166442122546]
我々は、差別的かつ生成的なKGCフレームワークと互換性のあるプラグイン・アンド・プレイ方式であるContextualization Distillation戦略を導入する。
提案手法は,大規模言語モデルに対して,コンパクトで構造的な三重項を文脈に富んだセグメントに変換するように指示することから始まる。
多様なデータセットとKGC技術にわたる総合的な評価は、我々のアプローチの有効性と適応性を強調している。
論文 参考訳(メタデータ) (2024-01-28T08:56:49Z) - SimTeG: A Frustratingly Simple Approach Improves Textual Graph Learning [131.04781590452308]
テキストグラフ学習におけるフラストレーションに富んだアプローチであるSimTeGを提案する。
まず、下流タスクで予め訓練されたLM上で、教師付きパラメータ効率の微調整(PEFT)を行う。
次に、微調整されたLMの最後の隠れ状態を用いてノード埋め込みを生成する。
論文 参考訳(メタデータ) (2023-08-03T07:00:04Z) - Skeleton Split Strategies for Spatial Temporal Graph Convolution
Networks [2.132096006921048]
人体の骨格表現は、この作業に有効であることが証明されている。
骨格グラフ上で畳み込み操作を行うための新しい手法のセットを示す。
論文 参考訳(メタデータ) (2021-08-03T05:57:52Z) - Keyphrase Extraction with Dynamic Graph Convolutional Networks and
Diversified Inference [50.768682650658384]
キーワード抽出(KE)は、ある文書でカバーされている概念やトピックを正確に表現するフレーズの集合を要約することを目的としている。
最近のシークエンス・ツー・シークエンス(Seq2Seq)ベースの生成フレームワークはKEタスクで広く使われ、様々なベンチマークで競合性能を得た。
本稿では,この2つの問題を同時に解くために,動的グラフ畳み込みネットワーク(DGCN)を採用することを提案する。
論文 参考訳(メタデータ) (2020-10-24T08:11:23Z) - Heuristic Semi-Supervised Learning for Graph Generation Inspired by
Electoral College [80.67842220664231]
本稿では,新たなノードやエッジを自動的に拡張して,高密度サブグラフ内のラベル類似性を向上する,新しい前処理手法であるElectoral College(ELCO)を提案する。
テストされたすべての設定において、我々の手法はベースモデルの平均スコアを4.7ポイントの広いマージンで引き上げるとともに、常に最先端のモデルよりも優れています。
論文 参考訳(メタデータ) (2020-06-10T14:48:48Z) - ENIGMA Anonymous: Symbol-Independent Inference Guiding Machine (system
description) [0.4893345190925177]
本稿では,飽和式自動定理証明器の勾配押し上げと神経誘導の実装について述べる。
勾配ブースティング法では、論理式のアリティに基づく符号化を考慮し、手動で抽象的な特徴を生成できる。
ニューラルネットワークでは,シンボルに依存しないグラフニューラルネットワーク(GNN)と,その用語や節の埋め込みを用いる。
論文 参考訳(メタデータ) (2020-02-13T09:44:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。