論文の概要: Relevant Entity Selection: Knowledge Graph Bootstrapping via Zero-Shot
Analogical Pruning
- arxiv url: http://arxiv.org/abs/2306.16296v1
- Date: Wed, 28 Jun 2023 15:17:59 GMT
- ステータス: 処理完了
- システム内更新日: 2023-06-29 13:46:57.612380
- Title: Relevant Entity Selection: Knowledge Graph Bootstrapping via Zero-Shot
Analogical Pruning
- Title(参考訳): 関連エンティティの選択:ゼロショット解析による知識グラフブートストラップ
- Authors: Lucas Jarnac, Miguel Couceiro, Pierre Monnin
- Abstract要約: そこで本研究では,KGのシードエンティティから始まり,その近傍のエンティティを保存・熟成するアナロジーに基づくアプローチを提案する。
ウィキデータに対する我々のアプローチは、ドメイン均質または異質なシードエンティティを含む2つの手動ラベル付きデータセットを通して評価する。
- 参考スコア(独自算出の注目度): 2.2237337682863125
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Knowledge Graph Construction (KGC) can be seen as an iterative process
starting from a high quality nucleus that is refined by knowledge extraction
approaches in a virtuous loop. Such a nucleus can be obtained from knowledge
existing in an open KG like Wikidata. However, due to the size of such generic
KGs, integrating them as a whole may entail irrelevant content and scalability
issues. We propose an analogy-based approach that starts from seed entities of
interest in a generic KG, and keeps or prunes their neighboring entities. We
evaluate our approach on Wikidata through two manually labeled datasets that
contain either domain-homogeneous or -heterogeneous seed entities. We
empirically show that our analogy-based approach outperforms LSTM, Random
Forest, SVM, and MLP, with a drastically lower number of parameters. We also
evaluate its generalization potential in a transfer learning setting. These
results advocate for the further integration of analogy-based inference in
tasks related to the KG lifecycle.
- Abstract(参考訳): 知識グラフ構築(kgc)は、高品質の核から始まった反復的なプロセスと見なすことができる。
このような核はWikidataのようなオープンなKGに存在する知識から得ることができる。
しかし、そのような汎用kgのサイズのため、それらを全体として統合することは、無関係なコンテンツとスケーラビリティの問題を伴う可能性がある。
我々は,汎用kg に対する興味を持つ種実体から始まり,それらの隣り合う実体を保持または従属するアナロジーに基づくアプローチを提案する。
ウィキデータに対する我々のアプローチは、ドメイン均質または異質なシードエンティティを含む2つの手動ラベル付きデータセットを通して評価する。
我々は,我々の類推に基づくアプローチがLSTM,ランダムフォレスト,SVM,MLPを著しく低いパラメータ数で上回ることを示す。
また,その一般化ポテンシャルを転送学習環境において評価する。
これらの結果は、KGライフサイクルに関連するタスクにおけるアナロジーに基づく推論のさらなる統合を提唱する。
関連論文リスト
- Distill-SynthKG: Distilling Knowledge Graph Synthesis Workflow for Improved Coverage and Efficiency [59.6772484292295]
大規模言語モデル(LLM)によって生成される知識グラフ(KG)は、検索・拡張生成(RAG)アプリケーションにとってますます価値が増している。
既存のKG抽出法は、大規模コーパスの処理に非効率なプロンプトベースのアプローチに依存している。
LLMに基づく多段階文書レベルのKGワークフローであるSynthKGを提案する。
我々はまた、RAGのための新しいグラフベースの検索フレームワークを設計する。
論文 参考訳(メタデータ) (2024-10-22T00:47:54Z) - KGPrune: a Web Application to Extract Subgraphs of Interest from Wikidata with Analogical Pruning [3.250579305400297]
我々はWikidataから関心のサブグラフを抽出するWebアプリケーションKGPruneを紹介する。
KGPruneは、類似の推論に基づくフラガープルーニングアルゴリズムを頼りに、関係のないものをプルーニングしながら、関連する隣人をのみ保持する。
KGPruneの関心は、企業KGのブートストラップと、略奪された美術品に関する知識の抽出という、2つの具体的な応用によって示される。
論文 参考訳(メタデータ) (2024-08-26T21:47:49Z) - Tree-of-Traversals: A Zero-Shot Reasoning Algorithm for Augmenting Black-box Language Models with Knowledge Graphs [72.89652710634051]
知識グラフ(KG)は、信頼性があり、構造化され、ドメイン固有であり、最新の外部知識を提供することで、Large Language Models(LLM)を補完する。
そこで本研究では,ゼロショット推論アルゴリズムであるTree-of-Traversalsを導入する。
論文 参考訳(メタデータ) (2024-07-31T06:01:24Z) - Wiki Entity Summarization Benchmark [9.25319552487389]
エンティティの要約は知識グラフにおけるエンティティの簡潔な要約を計算することを目的としている。
既存のデータセットとベンチマークは、しばしば数百のエンティティに制限される。
我々は、エンティティ、要約、およびそれらの接続からなる包括的なベンチマークであるWikESを提案する。
論文 参考訳(メタデータ) (2024-06-12T17:22:00Z) - Generate-on-Graph: Treat LLM as both Agent and KG in Incomplete Knowledge Graph Question Answering [87.67177556994525]
我々は、知識グラフ(KG)を探索しながら、新しい実写トリプルを生成する、Generate-on-Graph(GoG)と呼ばれる学習自由な手法を提案する。
GoGはIKGQAでLLMをエージェントとKGの両方として扱うThinking-Searching-Generatingフレームワークを通じて推論を行う。
論文 参考訳(メタデータ) (2024-04-23T04:47:22Z) - Natural Language Processing for Drug Discovery Knowledge Graphs:
promises and pitfalls [0.0]
薬物発見を支援するための知識グラフ(KGs)の構築と分析は、研究の話題となっている。
我々は、自然言語処理(NLP)を用いて、構造化されていないテキストをKGのデータソースとしてマイニングすることの約束と落とし穴について論じる。
論文 参考訳(メタデータ) (2023-10-24T07:35:24Z) - PyGraft: Configurable Generation of Synthetic Schemas and Knowledge
Graphs at Your Fingertips [3.5923669681271257]
PyGraftはPythonベースのツールで、カスタマイズされたドメインに依存しないスキーマとKGを生成する。
我々は,グラフベース機械学習(ML)などの領域において,新たなアプローチをベンチマークする上で,より多様なKGの生成を促進することを目的としている。
MLでは、モデルパフォーマンスと一般化能力のより包括的な評価が促進され、利用可能なベンチマークの限られたコレクションを超えることになる。
論文 参考訳(メタデータ) (2023-09-07T13:00:09Z) - Interactive Segmentation as Gaussian Process Classification [58.44673380545409]
クリックベースのインタラクティブセグメンテーション(IS)は、ユーザインタラクション下で対象オブジェクトを抽出することを目的としている。
現在のディープラーニング(DL)ベースの手法のほとんどは、主にセマンティックセグメンテーションの一般的なパイプラインに従っている。
本稿では,各画像上でガウス過程(GP)に基づく画素単位のバイナリ分類モデルとしてISタスクを定式化することを提案する。
論文 参考訳(メタデータ) (2023-02-28T14:01:01Z) - BertNet: Harvesting Knowledge Graphs with Arbitrary Relations from
Pretrained Language Models [65.51390418485207]
本稿では,事前学習したLMから任意の関係を持つ大規模KGを抽出する手法を提案する。
関係定義の最小限の入力により、アプローチは膨大な実体対空間を効率的に探索し、多様な正確な知識を抽出する。
我々は、異なるLMから400以上の新しい関係を持つKGを収穫するためのアプローチを展開している。
論文 参考訳(メタデータ) (2022-06-28T19:46:29Z) - OntoMerger: An Ontology Integration Library for Deduplicating and
Connecting Knowledge Graph Nodes [2.6553713413568913]
OntoMergerはPython統合ライブラリで、KGノードを非重複化する機能を備えている。
提案手法では,KGノードの集合,マッピング,切断を行い,結合階層とともに統合ノードの集合を生成する。
OntoMerger は様々な KG に適用できる。
論文 参考訳(メタデータ) (2022-06-05T18:52:26Z) - Connecting the Dots: A Knowledgeable Path Generator for Commonsense
Question Answering [50.72473345911147]
本稿では、一般的な共通センスQAフレームワークを、知識のあるパスジェネレータで拡張する。
KGの既存のパスを最先端の言語モデルで外挿することで、ジェネレータはテキスト内のエンティティのペアを動的で、潜在的に新しいマルチホップリレーショナルパスに接続することを学びます。
論文 参考訳(メタデータ) (2020-05-02T03:53:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。