論文の概要: PubGraph: A Large Scale Scientific Temporal Knowledge Graph
- arxiv url: http://arxiv.org/abs/2302.02231v1
- Date: Sat, 4 Feb 2023 20:03:55 GMT
- ステータス: 処理完了
- システム内更新日: 2023-02-07 19:30:07.282412
- Title: PubGraph: A Large Scale Scientific Temporal Knowledge Graph
- Title(参考訳): PubGraph: 大規模科学的一時的知識グラフ
- Authors: Kian Ahrabian, Xinwei Du, Richard Delwin Myloth, Arun Baalaaji Sankar
Ananthan, Jay Pujara
- Abstract要約: PubGraphは、大規模な時間的知識グラフ(KG)の形式を取り入れた、科学的進歩を研究するための新しいリソースである
時間的に整列したトレーニング,検証,テストのパーティションを備えた,トランスダクティブおよびインダクティブな設定のための新しいリンク予測ベンチマークを導入する。
PubGraphに適した2つの新しい帰納学習手法を開発し、明示的な特徴のないノード上で動作し、大規模なKGにスケールし、既存のモデルより優れた性能を発揮する。
- 参考スコア(独自算出の注目度): 11.240833731512609
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Research publications are the primary vehicle for sharing scientific progress
in the form of new discoveries, methods, techniques, and insights. Publications
have been studied from the perspectives of both content analysis and
bibliometric structure, but a barrier to more comprehensive studies of
scientific research is a lack of publicly accessible large-scale data and
resources. In this paper, we present PubGraph, a new resource for studying
scientific progress that takes the form of a large-scale temporal knowledge
graph (KG). It contains more than 432M nodes and 15.49B edges mapped to the
popular Wikidata ontology. We extract three KGs with varying sizes from
PubGraph to allow experimentation at different scales. Using these KGs, we
introduce a new link prediction benchmark for transductive and inductive
settings with temporally-aligned training, validation, and testing partitions.
Moreover, we develop two new inductive learning methods better suited to
PubGraph, operating on unseen nodes without explicit features, scaling to large
KGs, and outperforming existing models. Our results demonstrate that structural
features of past citations are sufficient to produce high-quality predictions
about new publications. We also identify new challenges for KG models,
including an adversarial community-based link prediction setting, zero-shot
inductive learning, and large-scale learning.
- Abstract(参考訳): 研究出版物は、新しい発見、方法、技術、洞察の形で科学的進歩を共有するための主要な手段である。
出版物は、コンテンツ分析と書誌構造の両方の観点から研究されてきたが、科学研究のより包括的な研究への障壁は、広くアクセス可能な大規模データや資源の欠如である。
本稿では,大規模時間知識グラフ(KG)の形式を取り入れた科学的進歩を研究するための新たな資料PubGraphを提案する。
432万以上のノードと15.49Bのエッジがウィキデータオントロジーにマッピングされている。
PubGraphから異なるサイズの3つのKGを抽出し、異なるスケールでの実験を可能にする。
これらのkgsを用いて,時間的に調整されたトレーニング,検証,テストパーティションを含むトランスダクティブおよびインダクティブ設定のための新しいリンク予測ベンチマークを導入する。
さらに,pubgraphに適合する2つの新しい帰納的学習手法を開発し,明示的な特徴を伴わずに未認識ノード上で動作し,大規模なkgsにスケールし,既存モデルを上回るパフォーマンスを示す。
その結果,過去の引用の構造的特徴は,新たな出版物の質の高い予測に十分であることがわかった。
また,敵対的なコミュニティベースリンク予測設定,ゼロショットインダクティブ学習,大規模学習など,kgモデルの新たな課題を特定する。
関連論文リスト
- Can Large Language Models Analyze Graphs like Professionals? A Benchmark, Datasets and Models [90.98855064914379]
グラフを処理するために,大規模言語モデル(LLM)のベンチマークであるProGraphを導入する。
その結果,現在のLCMの性能は不満足であり,最高のモデルでは36%の精度しか達成できないことがわかった。
本研究では,6つの広く使用されているグラフライブラリに基づいて,クローリングされたドキュメントと自動生成コードを含むLLM4Graphデータセットを提案する。
論文 参考訳(メタデータ) (2024-09-29T11:38:45Z) - OAG-Bench: A Human-Curated Benchmark for Academic Graph Mining [46.27513006781531]
OAG-BenchはOpen Academic Graph (OAG)をベースにした、包括的で、多面的で、きめ細かい人為的なベンチマークである。
OAG-Benchは10のタスク、20のデータセット、70以上のベースライン、120以上の実験結果をカバーする。
論文 参考訳(メタデータ) (2024-02-24T13:15:54Z) - Graph Domain Adaptation: Challenges, Progress and Prospects [61.9048172631524]
本稿では,グラフ間の効果的な知識伝達パラダイムとしてグラフ領域適応を提案する。
GDAは、ソースグラフとしてタスク関連のグラフを多数導入し、ソースグラフから学習した知識をターゲットグラフに適応させる。
研究状況と課題について概説し、分類学を提案し、代表作の詳細を紹介し、今後の展望について論じる。
論文 参考訳(メタデータ) (2024-02-01T02:44:32Z) - Universal Knowledge Graph Embeddings [4.322134229203427]
本稿では,大規模知識源からユニバーサル知識グラフの埋め込みを学習することを提案する。
私たちはDBpediaとWikidataをベースとした普遍的な埋め込みを、約1億5000万のエンティティ、1500万のリレーション、120億のトリプルで計算することで、私たちのアイデアをインスタンス化します。
論文 参考訳(メタデータ) (2023-10-23T13:07:46Z) - Counterfactual Learning on Graphs: A Survey [34.47646823407408]
グラフニューラルネットワーク(GNN)は,グラフ上での表現学習において大きな成功を収めている。
グラフ上のカウンターファクトラーニングは、これらの欠点を緩和する有望な結果を示している。
グラフ上の反ファクトフェアネス、説明可能性、リンク予測など、様々な手法が提案されている。
論文 参考訳(メタデータ) (2023-04-03T21:42:42Z) - The Semantic Scholar Open Data Platform [79.4493235243312]
セマンティック・スカラー(Semantic Scholar、S2)は、学術文献の発見と理解を支援することを目的としたオープンデータプラットフォームおよびウェブサイトである。
我々は、学術的なPDFコンテンツ抽出と知識グラフの自動構築のための最先端技術を用いて、パブリックおよびプロプライエタリなデータソースを組み合わせる。
このグラフには、構造解析されたテキスト、自然言語要約、ベクトル埋め込みなどの高度な意味的特徴が含まれている。
論文 参考訳(メタデータ) (2023-01-24T17:13:08Z) - A Survey of Knowledge Graph Reasoning on Graph Types: Static, Dynamic,
and Multimodal [57.8455911689554]
知識グラフ推論(KGR)は、知識グラフに基づくマイニング論理則に基づいて、既存の事実から新しい事実を推論することを目的としている。
質問応答やレコメンデーションシステムなど、多くのAIアプリケーションでKGを使うことに大きなメリットがあることが証明されている。
論文 参考訳(メタデータ) (2022-12-12T08:40:04Z) - Scientific Paper Extractive Summarization Enhanced by Citation Graphs [50.19266650000948]
我々は、引用グラフを活用して、異なる設定下での科学的論文の抽出要約を改善することに重点を置いている。
予備的な結果は、単純な教師なしフレームワークであっても、引用グラフが有用であることを示している。
そこで我々は,大規模ラベル付きデータが利用可能である場合のタスクにおいて,より正確な結果を得るために,グラフベースのスーパービジョン・サムライゼーション・モデル(GSS)を提案する。
論文 参考訳(メタデータ) (2022-12-08T11:53:12Z) - A Survey of Deep Graph Clustering: Taxonomy, Challenge, Application, and
Open Resource [87.7460720701592]
本稿では, この分野における公式定義, 評価, 開発について紹介する。
ディープグラフクラスタリング手法の分類は,グラフタイプ,ネットワークアーキテクチャ,学習パラダイム,クラスタリング手法など,4つの異なる基準に基づいて提示される。
コンピュータビジョン、自然言語処理、レコメンデーションシステム、ソーシャルネットワーク分析、バイオインフォマティクス、医学を含む6分野におけるディープグラフクラスタリング手法の適用について述べる。
論文 参考訳(メタデータ) (2022-11-23T11:31:11Z) - DIG: A Turnkey Library for Diving into Graph Deep Learning Research [39.58666190541479]
DIG: Dive into Graphsは研究指向のライブラリで、いくつかの高度なタスクで共通のグラフ深層学習アルゴリズムを統合および統合しています。
それぞれの方向に対して、データインターフェース、共通アルゴリズム、評価メトリクスの統合実装を提供します。
論文 参考訳(メタデータ) (2021-03-23T15:05:10Z) - GraphGen: A Scalable Approach to Domain-agnostic Labeled Graph
Generation [5.560715621814096]
グラフ生成モデルは、データマイニングの文献で広く研究されている。
最近の技術は、データから直接この分布を学習する方向に移行している。
本研究では、これらの制限をすべて克服するために、GraphGenと呼ばれるドメインに依存しないテクニックを開発します。
論文 参考訳(メタデータ) (2020-01-22T18:07:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。