論文の概要: Technical Report of Team GraphMIRAcles in the WikiKG90M-LSC Track of
OGB-LSC @ KDD Cup 2021
- arxiv url: http://arxiv.org/abs/2107.05476v1
- Date: Mon, 12 Jul 2021 14:44:16 GMT
- ステータス: 処理完了
- システム内更新日: 2021-07-13 18:35:42.334194
- Title: Technical Report of Team GraphMIRAcles in the WikiKG90M-LSC Track of
OGB-LSC @ KDD Cup 2021
- Title(参考訳): WikiKG90M-LSCによるOGB-LSC @ KDD Cup 2021のチームGraphMIRAclesの技術的報告
- Authors: Jianyu Cai, Jiajun Chen, Taoxing Pan, Zhanqiu Zhang, Jie Wang
- Abstract要約: 本稿では,基本モデルComplEx-CMRC,ルールマイナAMIE 3,および不足リンクを予測する推論モデルを統合するフレームワークを提案する。
実験の結果,テストデータセット上でのMRRは0.9707であることがわかった。
- 参考スコア(独自算出の注目度): 27.8022454323604
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Link prediction in large-scale knowledge graphs has gained increasing
attention recently. The OGB-LSC team presented OGB Large-Scale Challenge
(OGB-LSC), a collection of three real-world datasets for advancing the
state-of-the-art in large-scale graph machine learning. In this paper, we
introduce the solution of our team GraphMIRAcles in the WikiKG90M-LSC track of
OGB-LSC @ KDD Cup 2021. In the WikiKG90M-LSC track, the goal is to
automatically predict missing links in WikiKG90M, a large scale knowledge graph
extracted from Wikidata. To address this challenge, we propose a framework that
integrates three components -- a basic model ComplEx-CMRC, a rule miner AMIE 3,
and an inference model to predict missing links. Experiments demonstrate that
our solution achieves an MRR of 0.9707 on the test dataset. Moreover, as the
knowledge distillation in the inference model uses test tail candidates --
which are unavailable in practice -- we conduct ablation studies on knowledge
distillation. Experiments demonstrate that our model without knowledge
distillation achieves an MRR of 0.9533 on the full validation dataset.
- Abstract(参考訳): 大規模知識グラフにおけるリンク予測は近年注目を集めている。
OGB-LSCチームはOGB Large-Scale Challenge (OGB-LSC)を発表した。
本稿では、OGB-LSC @ KDD Cup 2021のWikiKG90M-LSCトラックで、チームGraphMIRAclesのソリューションを紹介します。
WikiKG90M-LSCトラックでは、Wikidataから抽出された大規模知識グラフであるWikiKG90Mの欠落リンクを自動的に予測することを目的としている。
この課題に対処するため,我々は3つのコンポーネント – ComplEx-CMRC の基本モデル,ルールマイニング AMIE 3 と,リンク不足を予測する推論モデル – を統合するフレームワークを提案する。
実験の結果,テストデータセット上でのMRRは0.9707であることがわかった。
さらに, 推論モデルの知識蒸留では, 実際に利用できないテストテール候補を用いて, 知識蒸留に関するアブレーション研究を行っている。
実験により,本モデルが完全検証データセット上で0.9533のMRRを達成することを示す。
関連論文リスト
- Rapid Adaptation in Online Continual Learning: Are We Evaluating It
Right? [135.71855998537347]
オンライン連続学習(OCL)アルゴリズムの適応性を評価するための一般的な手法を,オンライン精度の指標を用いて再検討する。
空白のブラインド分類器でさえ、非現実的に高いオンライン精度を達成できるため、この指標は信頼できない。
既存のOCLアルゴリズムは、オンラインの精度も高いが、有用な情報の保持は不十分である。
論文 参考訳(メタデータ) (2023-05-16T08:29:33Z) - GreenKGC: A Lightweight Knowledge Graph Completion Method [32.528770408502396]
GreenKGCは、知識グラフ内のエンティティ間の欠落した関係を見つけることを目的としている。
表現学習、特徴抽出、決定学習の3つのモジュールで構成されている。
低次元では、GreenKGCはほとんどのデータセットでSOTAメソッドより優れている。
論文 参考訳(メタデータ) (2022-08-19T03:33:45Z) - Few-Shot Non-Parametric Learning with Deep Latent Variable Model [50.746273235463754]
遅延変数を用いた圧縮による非パラメトリック学習(NPC-LV)を提案する。
NPC-LVは、ラベルなしデータが多いがラベル付きデータはほとんどないデータセットの学習フレームワークである。
我々は,NPC-LVが低データ構造における画像分類における3つのデータセットの教師あり手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2022-06-23T09:35:03Z) - MDistMult: A Multiple Scoring Functions Model for Link Prediction on
Antiviral Drugs Knowledge Graph [7.025654957281267]
リンク予測タスクは、(e, r, t) または (h, r, e) の欠落したエンティティを予測することを目的としており、h と t は特定のエンティティであり、e は予測が必要なエンティティであり、r は関係である。
本稿では,複数のスコアリング関数を利用して既存のトリプルからより多くの特徴を抽出するMDistMultモデルを提案する。
論文 参考訳(メタデータ) (2021-11-29T11:51:20Z) - Node Feature Extraction by Self-Supervised Multi-scale Neighborhood
Prediction [123.20238648121445]
我々は、新しい自己教師型学習フレームワーク、グラフ情報支援ノード機能exTraction (GIANT)を提案する。
GIANT は eXtreme Multi-label Classification (XMC) 形式を利用しており、これはグラフ情報に基づいた言語モデルの微調整に不可欠である。
我々は,Open Graph Benchmarkデータセット上での標準GNNパイプラインよりもGIANTの方が優れた性能を示す。
論文 参考訳(メタデータ) (2021-10-29T19:55:12Z) - NOTE: Solution for KDD-CUP 2021 WikiKG90M-LSC [3.0716126507403545]
最近の表現学習法はFB15k-237のような標準データセットで大きな成功を収めている。
我々は、OTE、QuatE、RotatE、TransEなど、さまざまなドメインで高度なアルゴリズムをトレーニングし、三つ子を学ぶ。
表現の他に,主実体,関係,尾実体の様々な統計的確率を最終予測に用いている。
論文 参考訳(メタデータ) (2021-07-05T09:30:24Z) - On Graph Neural Network Ensembles for Large-Scale Molecular Property
Prediction [0.0]
PCQM4M-LSCデータセットは、約3.8Mグラフ上の分子HOMO-LUMO特性予測タスクを定義する。
3つのグラフニューラルネットワークモデルのアンサンブルを構築する、現行のワーク・イン・プログレス・ソリューションを紹介します。
論文 参考訳(メタデータ) (2021-06-29T15:58:34Z) - OGB-LSC: A Large-Scale Challenge for Machine Learning on Graphs [69.23600404232883]
OGB Large-Scale Challenge(OGB-LSC)は、大規模グラフMLにおける最先端の進歩のための3つの実世界のデータセットのコレクションです。
OGB-LSCは専用のベースライン実験を提供し、表現型グラフMLモデルを巨大なデータセットにスケールアップします。
論文 参考訳(メタデータ) (2021-03-17T04:08:03Z) - 2nd Place Scheme on Action Recognition Track of ECCV 2020 VIPriors
Challenges: An Efficient Optical Flow Stream Guided Framework [57.847010327319964]
我々は、小さなデータセットでモデルをスクラッチからトレーニングできるデータ効率フレームワークを提案する。
具体的には、3D中心差分畳み込み演算を導入することで、新しいC3Dニューラルネットワークベースの2ストリームフレームワークを提案する。
提案手法は,大規模データセット上で事前学習したモデルがなくても,有望な結果が得られることを実証した。
論文 参考訳(メタデータ) (2020-08-10T09:50:28Z) - Mix Dimension in Poincar\'{e} Geometry for 3D Skeleton-based Action
Recognition [57.98278794950759]
グラフ畳み込みネットワーク(GCN)はすでに、不規則なデータをモデル化する強力な能力を実証している。
本稿では,ポアンカー幾何学を用いて定義した空間時空間GCNアーキテクチャを提案する。
提案手法を,現在最大規模の2つの3次元データセット上で評価する。
論文 参考訳(メタデータ) (2020-07-30T18:23:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。