論文の概要: IRT2: Inductive Linking and Ranking in Knowledge Graphs of Varying Scale
- arxiv url: http://arxiv.org/abs/2301.00716v1
- Date: Mon, 2 Jan 2023 15:19:21 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-03 13:31:04.020756
- Title: IRT2: Inductive Linking and Ranking in Knowledge Graphs of Varying Scale
- Title(参考訳): IRT2:Varyingスケールの知識グラフにおけるインダクティブリンクとランク付け
- Authors: Felix Hamann, Adrian Ulges, Maurice Falk
- Abstract要約: 産業用ユースケースのためのドメイン固有の知識モデルを構築するという課題に対処する。
我々の焦点は、実用的なツールの基礎となる帰納的リンク予測モデルである。
- 参考スコア(独自算出の注目度): 1.3621712165154805
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We address the challenge of building domain-specific knowledge models for
industrial use cases, where labelled data and taxonomic information is
initially scarce. Our focus is on inductive link prediction models as a basis
for practical tools that support knowledge engineers with exploring text
collections and discovering and linking new (so-called open-world) entities to
the knowledge graph. We argue that - though neural approaches to text mining
have yielded impressive results in the past years - current benchmarks do not
reflect the typical challenges encountered in the industrial wild properly.
Therefore, our first contribution is an open benchmark coined IRT2 (inductive
reasoning with text) that (1) covers knowledge graphs of varying sizes
(including very small ones), (2) comes with incidental, low-quality text
mentions, and (3) includes not only triple completion but also ranking, which
is relevant for supporting experts with discovery tasks.
We investigate two neural models for inductive link prediction, one based on
end-to-end learning and one that learns from the knowledge graph and text data
in separate steps. These models compete with a strong bag-of-words baseline.
The results show a significant advance in performance for the neural approaches
as soon as the available graph data decreases for linking. For ranking, the
results are promising, and the neural approaches outperform the sparse
retriever by a wide margin.
- Abstract(参考訳): 我々は,ラベル付きデータと分類情報が最初に不足する産業用ユースケースのためのドメイン固有知識モデルの構築という課題に対処した。
我々は,知識技術者がテキストコレクションを探索し,新たな(いわゆるオープンワールド)エンティティを知識グラフに発見・リンクする実践的ツールの基礎として,帰納的リンク予測モデルに注目している。
テキストマイニングに対するニューラルなアプローチは、過去数年間で驚くべき成果を上げてきたが、現在のベンチマークは、産業の野で遭遇した典型的な課題を適切に反映していない。
したがって,第1の貢献は irt2 (inductive reasoning with text) というオープンベンチマークであり,(1) さまざまなサイズの知識グラフ (ごく小さいものを含む) をカバーすること,(2) に付随的に低品質なテキストが言及されること,(3) トリプルコンプリートだけでなくランキングも含んでいること,など,発見課題のエキスパートを支援すること,などである。
インダクティブリンク予測のための2つのニューラルモデルを検討した。1つはエンドツーエンド学習に基づくもので、もう1つは知識グラフとテキストデータから別々のステップで学習する。
これらのモデルは、強い単語のベースラインと競合する。
その結果、利用可能なグラフデータがリンクのために減少すると、ニューラルアプローチのパフォーマンスが大幅に向上することが示された。
ランキングでは、結果は有望であり、ニューラルアプローチはスパースレトリバーよりも広いマージンで優れている。
関連論文リスト
- Graphusion: Leveraging Large Language Models for Scientific Knowledge Graph Fusion and Construction in NLP Education [14.368011453534596]
フリーテキストからのゼロショット知識グラフフレームワークであるGraphusionを紹介する。
核融合モジュールは、エンティティのマージ、競合解決、新しい三重項発見を取り入れた三重項のグローバルなビューを提供する。
本評価は,リンク予測における教師付きベースラインの精度を最大10%超えることを示す。
論文 参考訳(メタデータ) (2024-07-15T15:13:49Z) - Rethinking the Effectiveness of Graph Classification Datasets in Benchmarks for Assessing GNNs [7.407592553310068]
本稿では,単純な手法とGNN間の性能差を調べるための,公正なベンチマークフレームワークに基づく経験的プロトコルを提案する。
また,データセットの複雑性とモデル性能を両立させることにより,データセットの有効性を定量化する新しい指標を提案する。
我々の発見は、ベンチマークデータセットの現在の理解に光を当て、新しいプラットフォームは、グラフ分類ベンチマークの将来的な進化を後押しする可能性がある。
論文 参考訳(メタデータ) (2024-07-06T08:33:23Z) - G-SAP: Graph-based Structure-Aware Prompt Learning over Heterogeneous Knowledge for Commonsense Reasoning [8.02547453169677]
本稿では,G-SAP という名称のコモンセンス推論のためのグラフベース構造認識プロンプト学習モデルを提案する。
特にエビデンスグラフは、ConceptNet、Wikipedia、Cambridge Dictionaryといった複数の知識ソースを統合することで構築される。
その結果、既存のモデル、特にOpenbookQAデータセット上のSoTA LM+GNNsモデルよりも6.12%改善された。
論文 参考訳(メタデータ) (2024-05-09T08:28:12Z) - Exploring Large Language Models for Knowledge Graph Completion [17.139056629060626]
我々は知識グラフのトリプルをテキストシーケンスとみなし、知識グラフLLMと呼ばれる革新的なフレームワークを導入する。
提案手法では,三重項の実体的記述と関係的記述をプロンプトとして利用し,その応答を予測に利用する。
種々のベンチマーク知識グラフを用いた実験により,三重分類や関係予測といったタスクにおいて,本手法が最先端の性能を達成することを示す。
論文 参考訳(メタデータ) (2023-08-26T16:51:17Z) - SimTeG: A Frustratingly Simple Approach Improves Textual Graph Learning [131.04781590452308]
テキストグラフ学習におけるフラストレーションに富んだアプローチであるSimTeGを提案する。
まず、下流タスクで予め訓練されたLM上で、教師付きパラメータ効率の微調整(PEFT)を行う。
次に、微調整されたLMの最後の隠れ状態を用いてノード埋め込みを生成する。
論文 参考訳(メタデータ) (2023-08-03T07:00:04Z) - Benchmarking Node Outlier Detection on Graphs [90.29966986023403]
グラフの外れ値検出は、多くのアプリケーションにおいて、新しいが重要な機械学習タスクである。
UNODと呼ばれるグラフに対して、最初の包括的教師なしノード外乱検出ベンチマークを示す。
論文 参考訳(メタデータ) (2022-06-21T01:46:38Z) - A Graph-Enhanced Click Model for Web Search [67.27218481132185]
ウェブ検索のための新しいグラフ強調クリックモデル(GraphCM)を提案する。
セッション内情報とセッション間情報の両方を、スパーシリティ問題とコールドスタート問題に活用する。
論文 参考訳(メタデータ) (2022-06-17T08:32:43Z) - Towards Open-World Feature Extrapolation: An Inductive Graph Learning
Approach [80.8446673089281]
グラフ表現と学習を伴う新しい学習パラダイムを提案する。
本フレームワークは,1) 下位モデルとしてのバックボーンネットワーク(フィードフォワードニューラルネットなど)が,予測ラベルの入力および出力として機能を取り,2) 上位モデルとしてのグラフニューラルネットワークが,観測データから構築された特徴データグラフをメッセージパッシングすることで,新機能の埋め込みを外挿することを学ぶ。
論文 参考訳(メタデータ) (2021-10-09T09:02:45Z) - Learning to Extrapolate Knowledge: Transductive Few-shot Out-of-Graph
Link Prediction [69.1473775184952]
数発のアウトオブグラフリンク予測という現実的な問題を導入する。
我々は,新しいメタ学習フレームワークによってこの問題に対処する。
我々は,知識グラフの補完と薬物と薬物の相互作用予測のために,複数のベンチマークデータセット上でモデルを検証した。
論文 参考訳(メタデータ) (2020-06-11T17:42:46Z) - Exploiting Structured Knowledge in Text via Graph-Guided Representation
Learning [73.0598186896953]
本稿では、知識グラフからのガイダンスを用いて、生テキスト上で学習する2つの自己教師型タスクを提案する。
エンティティレベルのマスキング言語モデルに基づいて、最初のコントリビューションはエンティティマスキングスキームです。
既存のパラダイムとは対照的に,本手法では事前学習時にのみ,知識グラフを暗黙的に使用する。
論文 参考訳(メタデータ) (2020-04-29T14:22:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。