論文の概要: Better Call the Plumber: Orchestrating Dynamic Information Extraction
Pipelines
- arxiv url: http://arxiv.org/abs/2102.10966v1
- Date: Mon, 22 Feb 2021 13:14:02 GMT
- ステータス: 処理完了
- システム内更新日: 2021-02-23 14:54:46.013119
- Title: Better Call the Plumber: Orchestrating Dynamic Information Extraction
Pipelines
- Title(参考訳): より優れたPlumber: 動的情報抽出パイプラインのオーケストレーション
- Authors: Mohamad Yaser Jaradeh, Kuldeep Singh, Markus Stocker, Andreas Both,
S\"oren Auer
- Abstract要約: plumberは、研究コミュニティの無関係なieの取り組みをまとめる最初のフレームワークである。
入力文に基づく最適パイプライン選択の最適化問題について検討する。
本研究は,KG情報抽出パイプラインの動的生成におけるPlumberの有効性を示す。
- 参考スコア(独自算出の注目度): 1.7688094977719888
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In the last decade, a large number of Knowledge Graph (KG) information
extraction approaches were proposed. Albeit effective, these efforts are
disjoint, and their collective strengths and weaknesses in effective KG
information extraction (IE) have not been studied in the literature. We propose
Plumber, the first framework that brings together the research community's
disjoint IE efforts. The Plumber architecture comprises 33 reusable components
for various KG information extraction subtasks, such as coreference resolution,
entity linking, and relation extraction. Using these components,Plumber
dynamically generates suitable information extraction pipelines and offers
overall 264 distinct pipelines.We study the optimization problem of choosing
suitable pipelines based on input sentences. To do so, we train a
transformer-based classification model that extracts contextual embeddings from
the input and finds an appropriate pipeline. We study the efficacy of Plumber
for extracting the KG triples using standard datasets over two KGs: DBpedia,
and Open Research Knowledge Graph (ORKG). Our results demonstrate the
effectiveness of Plumber in dynamically generating KG information extraction
pipelines,outperforming all baselines agnostics of the underlying KG.
Furthermore,we provide an analysis of collective failure cases, study the
similarities and synergies among integrated components, and discuss their
limitations.
- Abstract(参考訳): 過去10年間で、多くの知識グラフ(KG)情報抽出手法が提案された。
有効ではあるが、これらの取り組みは相容れないものであり、KG情報抽出(IE)におけるその集団的強みと弱点は文献で研究されていない。
Plumberは、研究コミュニティのIEとの相反する取り組みをまとめた最初のフレームワークである。
Plumberアーキテクチャは、コア参照解決、エンティティリンク、関係抽出などの様々なKG情報抽出サブタスクのための33の再利用可能なコンポーネントを含む。
これらのコンポーネントを用いて、Plumberは適切な情報抽出パイプラインを動的に生成し、入力文に基づいて適切なパイプラインを選択する際の最適化問題について検討する。
そこで我々は,入力からコンテキスト埋め込みを抽出し,適切なパイプラインを見つける変換器に基づく分類モデルを訓練する。
DBpedia と Open Research Knowledge Graph (ORKG) の2つの KG 上の標準データセットを用いて KG トリプルを抽出するための Plumber の有効性を検討する。
本研究は,KG情報抽出パイプラインの動的生成におけるPlumberの有効性を示すものである。
さらに,集合的障害事例の分析を行い,統合コンポーネント間の類似性と相乗効果について検討し,その限界について考察する。
関連論文リスト
- Distill-SynthKG: Distilling Knowledge Graph Synthesis Workflow for Improved Coverage and Efficiency [59.6772484292295]
大規模言語モデル(LLM)によって生成される知識グラフ(KG)は、検索・拡張生成(RAG)アプリケーションにとってますます価値が増している。
既存のKG抽出法は、大規模コーパスの処理に非効率なプロンプトベースのアプローチに依存している。
LLMに基づく多段階文書レベルのKGワークフローであるSynthKGを提案する。
我々はまた、RAGのための新しいグラフベースの検索フレームワークを設計する。
論文 参考訳(メタデータ) (2024-10-22T00:47:54Z) - Triplètoile: Extraction of Knowledge from Microblogging Text [7.848242781280095]
ソーシャルメディアプラットフォーム上でのマイクロブログ投稿からオープンドメインエンティティを含む知識グラフの抽出に適した情報抽出パイプラインを提案する。
我々のパイプラインは、単語の埋め込みに対する階層的クラスタリングを通じて、依存関係解析を活用し、教師なしの方法でエンティティ関係を分類する。
本稿では,デジタルトランスフォーメーションに関する1万ツイートのコーパスからセマンティック・トリプルを抽出し,生成した知識グラフを公開するユースケースを提案する。
論文 参考訳(メタデータ) (2024-08-27T09:35:13Z) - Anchoring Path for Inductive Relation Prediction in Knowledge Graphs [69.81600732388182]
APSTはAPとCPを統一されたSentence Transformerアーキテクチャの入力として扱う。
我々は3つの公開データセット上でAPSTを評価し、36のトランスダクティブ、インダクティブ、および数ショットの実験的設定のうち30の最先端(SOTA)性能を達成する。
論文 参考訳(メタデータ) (2023-12-21T06:02:25Z) - Natural Language Processing for Drug Discovery Knowledge Graphs:
promises and pitfalls [0.0]
薬物発見を支援するための知識グラフ(KGs)の構築と分析は、研究の話題となっている。
我々は、自然言語処理(NLP)を用いて、構造化されていないテキストをKGのデータソースとしてマイニングすることの約束と落とし穴について論じる。
論文 参考訳(メタデータ) (2023-10-24T07:35:24Z) - Collaborative Knowledge Graph Fusion by Exploiting the Open Corpus [59.20235923987045]
知識表現の質を維持しながら、新たに収穫した3倍の知識グラフを豊かにすることは困難である。
本稿では,付加コーパスから得られる情報を用いてKGを精製するシステムを提案する。
論文 参考訳(メタデータ) (2022-06-15T12:16:10Z) - Meta-Learning Based Knowledge Extrapolation for Knowledge Graphs in the
Federated Setting [43.85991094675398]
本稿では,新たな知識グラフ(KG)をフェデレートした環境に組み込むための知識補間問題について検討する。
この問題では、既存のKGでトレーニングされたモデルが、未知の実体と関係を持つ新しいKGを組み込む必要がある。
メタラーニング設定では、既存のKG上に一連のタスクをサンプリングし、新興KG上のリンク予測タスクを模倣する。
サンプルタスクに基づいてグラフニューラルネットワークフレームワークをメタトレーニングし,構造情報に基づく未知のコンポーネントの機能の構築と,それらに対する出力埋め込みを実現する。
論文 参考訳(メタデータ) (2022-05-10T06:27:32Z) - DSKReG: Differentiable Sampling on Knowledge Graph for Recommendation
with Relational GNN [59.160401038969795]
我々は,GNN(DSKReG)を用いた推薦のための知識グラフの識別可能なサンプリングを提案する。
そこで本研究では,モデル学習手順と組み合わせて,関連する項目の選択を最適化する,識別可能なサンプリング戦略を考案する。
実験の結果,我々のモデルは最先端のKGベースのレコメンデータシステムよりも優れていた。
論文 参考訳(メタデータ) (2021-08-26T16:19:59Z) - A Recommender System for Scientific Datasets and Analysis Pipelines [0.0]
高品質な公開データセットとパイプラインの増加を考えると、明確な互換性の欠如は、これらのリソースの発見可能性と再利用性を脅かしている。
本研究では,前回の実行実績に基づくパイプラインやデータセットを推薦するための協調フィルタリングシステムの実現可能性について検討する。
我々は、証明に基づくパイプラインとデータセットレコメンデータは、オープンサイエンスリソースの共有と利用に有効であり、有益である、と結論付けている。
論文 参考訳(メタデータ) (2021-08-20T17:11:33Z) - HittER: Hierarchical Transformers for Knowledge Graph Embeddings [85.93509934018499]
複雑な知識グラフにおける実体と関係の表現を学習するためにHittを提案する。
実験結果から,Hittは複数リンク予測において最先端の新たな結果が得られることがわかった。
さらに,HittをBERTに統合する簡単なアプローチを提案し,その効果を2つのFreebaseファクトイド対応データセットで示す。
論文 参考訳(メタデータ) (2020-08-28T18:58:15Z) - ENT-DESC: Entity Description Generation by Exploring Knowledge Graph [53.03778194567752]
実際には、出力記述が最も重要な知識のみをカバーするため、入力知識は十分以上である可能性がある。
我々は、KG-to-textにおけるこのような実践的なシナリオの研究を容易にするために、大規模で挑戦的なデータセットを導入する。
本稿では,元のグラフ情報をより包括的に表現できるマルチグラフ構造を提案する。
論文 参考訳(メタデータ) (2020-04-30T14:16:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。