論文の概要: Evaluation of Pipelines for Data Integration into Knowledge Graphs
- arxiv url: http://arxiv.org/abs/2605.22304v1
- Date: Thu, 21 May 2026 10:52:48 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-22 16:35:42.217199
- Title: Evaluation of Pipelines for Data Integration into Knowledge Graphs
- Title(参考訳): 知識グラフへのデータ統合のためのパイプラインの評価
- Authors: Marvin Hofer, Erhard Rahm,
- Abstract要約: 既存のKGに異なる種類の入力データを取り込み、統合パイプラインを評価するための新しいベンチマークKGI-Benchを提案する。
パイプラインのアウトプットを3つの相補的な品質指標、正確性、一貫性で分析し、パイプラインを評価する。
12のパイプラインを比較評価し、異なる入力データフォーマットと設計選択でそれらの振る舞いを分析します。
- 参考スコア(独自算出の注目度): 1.5397834466394758
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Integrating new data into knowledge graphs (KG) typically involves different tasks that are executed within workflows or pipelines There are many possible pipelines for a specific integration problem but there is not yet a general approach to evaluate the overall quality and performance of such pipelines to be able to determine the best choices. We therefore propose a new benchmark KGI-Bench to evaluate integration pipelines that ingest different kinds of input data into an existing KG. We evaluate pipelines by analyzing their output, i.e., the updated KG, with the three complementary quality metrics coverage, correctness and consistency. We also provide benchmark datasets (seed KG, overlapping input data of three formats, reference KG as a ground truth) for the movie domain. To demonstrate the applicability and usefulness of the proposed benchmark, we comparatively evaluate 12 pipelines and analyze their behavior across different input data formats and design choices.
- Abstract(参考訳): 新しいデータをナレッジグラフ(KG)に統合するには、ワークフローやパイプライン内で実行されるさまざまなタスクが一般的である。
そこで我々は,既存のKGに異なる種類の入力データを取り込み,統合パイプラインを評価するためのベンチマークKGI-Benchを提案する。
パイプラインの出力、すなわち、更新されたKGを3つの相補的な品質指標カバレッジ、正確性、一貫性で分析することで、パイプラインを評価する。
また、映画の領域に対して、ベンチマークデータセット(シードKG、3つのフォーマットの入力データを重複させ、KGを根拠として参照する)も提供します。
提案するベンチマークの適用性と有用性を示すため,12のパイプラインを比較評価し,異なる入力データ形式と設計選択の振る舞いを分析する。
関連論文リスト
- Integrating Meta-Features with Knowledge Graph Embeddings for Meta-Learning [8.071711833525475]
パイプライン性能推定(PPE)とデータセット性能に基づく類似度推定(DPSE)の2つの重要なメタ学習タスク。
既存のアプローチは主にデータセットのメタ機能に依存して、データセットを数値的に表現し、これらのメタ学習タスクを近似する。
KGmetaSPは,既存の実験データを利用してこれらのインタラクションを捕捉し,PPEとDPSEの両方を改善した知識グラフ埋め込み手法である。
論文 参考訳(メタデータ) (2026-03-20T11:57:25Z) - Automatic End-to-End Data Integration using Large Language Models [3.188426002064626]
我々は、GPT-5.2を使用して、パイプラインを特定のユースケースに適応させるために必要なすべてのアーティファクトを生成する自動データ統合パイプラインを提案する。
このLLMパイプラインの性能と人間設計パイプラインの性能を3つのケーススタディで比較した。
我々の実験によると、LLMベースのパイプラインは、人間設計のパイプラインのように、いくつかのタスクでさらに良い結果をもたらすことができる。
論文 参考訳(メタデータ) (2026-03-11T08:56:55Z) - KGpipe: Generation and Evaluation of Pipelines for Data Integration into Knowledge Graphs [1.5397834466394758]
多様な情報源から高品質な知識グラフ(KG)を構築するには、情報抽出、データ変換、オントロジーマッピング、エンティティマッチング、データ融合の手法を組み合わせる必要がある。
既存のツールやLLM(Large Language Model)機能を組み合わせてパイプラインを定義し実行するための新しいフレームワークであるKGpipeを提案する。
論文 参考訳(メタデータ) (2025-11-23T09:21:14Z) - Can Knowledge-Graph-based Retrieval Augmented Generation Really Retrieve What You Need? [57.28763506780752]
GraphFlowは、テキストリッチなKGから現実世界のクエリに必要な正確で多様な知識を効率的に取得するフレームワークである。
GPT-4oを含む強力なKG-RAGベースラインを10%上回り、ヒット率とリコール率で上回る。
また、KGを見えないものに強く一般化し、その有効性と堅牢性を示す。
論文 参考訳(メタデータ) (2025-10-18T17:06:49Z) - Distill-SynthKG: Distilling Knowledge Graph Synthesis Workflow for Improved Coverage and Efficiency [59.6772484292295]
大規模言語モデル(LLM)によって生成される知識グラフ(KG)は、検索・拡張生成(RAG)アプリケーションにとってますます価値が増している。
既存のKG抽出法は、大規模コーパスの処理に非効率なプロンプトベースのアプローチに依存している。
LLMに基づく多段階文書レベルのKGワークフローであるSynthKGを提案する。
我々はまた、RAGのための新しいグラフベースの検索フレームワークを設計する。
論文 参考訳(メタデータ) (2024-10-22T00:47:54Z) - DeepfakeBench: A Comprehensive Benchmark of Deepfake Detection [55.70982767084996]
ディープフェイク検出の分野で見落とされがちな課題は、標準化され、統一され、包括的なベンチマークがないことである。
DeepfakeBenchと呼ばれる,3つの重要なコントリビューションを提供するディープフェイク検出のための,最初の包括的なベンチマークを提示する。
DeepfakeBenchには15の最先端検出方法、9CLデータセット、一連のDeepfake検出評価プロトコルと分析ツール、包括的な評価ツールが含まれている。
論文 参考訳(メタデータ) (2023-07-04T01:34:41Z) - DSKReG: Differentiable Sampling on Knowledge Graph for Recommendation
with Relational GNN [59.160401038969795]
我々は,GNN(DSKReG)を用いた推薦のための知識グラフの識別可能なサンプリングを提案する。
そこで本研究では,モデル学習手順と組み合わせて,関連する項目の選択を最適化する,識別可能なサンプリング戦略を考案する。
実験の結果,我々のモデルは最先端のKGベースのレコメンデータシステムよりも優れていた。
論文 参考訳(メタデータ) (2021-08-26T16:19:59Z) - Better Call the Plumber: Orchestrating Dynamic Information Extraction
Pipelines [1.7688094977719888]
plumberは、研究コミュニティの無関係なieの取り組みをまとめる最初のフレームワークである。
入力文に基づく最適パイプライン選択の最適化問題について検討する。
本研究は,KG情報抽出パイプラインの動的生成におけるPlumberの有効性を示す。
論文 参考訳(メタデータ) (2021-02-22T13:14:02Z) - Exploring and Evaluating Attributes, Values, and Structures for Entity
Alignment [100.19568734815732]
エンティティアライメント(EA)は、さまざまなKGから等価なエンティティをリンクすることで、リッチコンテンツの統合知識グラフ(KG)を構築することを目的としている。
属性・トリプルは重要なアライメント信号も提供できますが、まだ十分に調査されていません。
本稿では,属性値エンコーダを用いてKGをサブグラフに分割し,属性の様々なタイプを効率的にモデル化することを提案する。
論文 参考訳(メタデータ) (2020-10-07T08:03:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。