論文の概要: KGpipe: Generation and Evaluation of Pipelines for Data Integration into Knowledge Graphs
- arxiv url: http://arxiv.org/abs/2511.18364v1
- Date: Sun, 23 Nov 2025 09:21:14 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-25 18:34:24.799237
- Title: KGpipe: Generation and Evaluation of Pipelines for Data Integration into Knowledge Graphs
- Title(参考訳): KGpipe: 知識グラフへのデータ統合のためのパイプラインの生成と評価
- Authors: Marvin Hofer, Erhard Rahm,
- Abstract要約: 多様な情報源から高品質な知識グラフ(KG)を構築するには、情報抽出、データ変換、オントロジーマッピング、エンティティマッチング、データ融合の手法を組み合わせる必要がある。
既存のツールやLLM(Large Language Model)機能を組み合わせてパイプラインを定義し実行するための新しいフレームワークであるKGpipeを提案する。
- 参考スコア(独自算出の注目度): 1.5397834466394758
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Building high-quality knowledge graphs (KGs) from diverse sources requires combining methods for information extraction, data transformation, ontology mapping, entity matching, and data fusion. Numerous methods and tools exist for each of these tasks, but support for combining them into reproducible and effective end-to-end pipelines is still lacking. We present a new framework, KGpipe for defining and executing integration pipelines that can combine existing tools or LLM (Large Language Model) functionality. To evaluate different pipelines and the resulting KGs, we propose a benchmark to integrate heterogeneous data of different formats (RDF, JSON, text) into a seed KG. We demonstrate the flexibility of KGpipe by running and comparatively evaluating several pipelines integrating sources of the same or different formats using selected performance and quality metrics.
- Abstract(参考訳): 多様な情報源から高品質な知識グラフ(KG)を構築するには、情報抽出、データ変換、オントロジーマッピング、エンティティマッチング、データ融合の手法を組み合わせる必要がある。
これらのタスクごとに多くのメソッドやツールが存在するが、再現可能で効果的なエンドツーエンドパイプラインにそれらを組み合わせることのサポートはまだ不足している。
既存のツールやLLM(Large Language Model)機能を組み合わせた統合パイプラインの定義と実行のための新しいフレームワークであるKGpipeを提案する。
異なるパイプラインと結果のKGを評価するために、異なるフォーマット(RDF、JSON、テキスト)の異種データをシードKGに統合するベンチマークを提案する。
我々は、同じまたは異なるフォーマットのソースを統合する複数のパイプラインを、選択されたパフォーマンスと品質メトリクスを使用して実行し、比較評価することで、KGpipeの柔軟性を実証する。
関連論文リスト
- Can Knowledge-Graph-based Retrieval Augmented Generation Really Retrieve What You Need? [57.28763506780752]
GraphFlowは、テキストリッチなKGから現実世界のクエリに必要な正確で多様な知識を効率的に取得するフレームワークである。
GPT-4oを含む強力なKG-RAGベースラインを10%上回り、ヒット率とリコール率で上回る。
また、KGを見えないものに強く一般化し、その有効性と堅牢性を示す。
論文 参考訳(メタデータ) (2025-10-18T17:06:49Z) - MSRS: Evaluating Multi-Source Retrieval-Augmented Generation [51.717139132190574]
多くの現実世界のアプリケーションは、複数のソースにまたがる情報を統合して要約する能力を必要としている。
本稿では、RAGシステムに対して異なるソース間で情報を統合するための評価ベンチマークを構築するためのスケーラブルなフレームワークを提案する。
論文 参考訳(メタデータ) (2025-08-28T14:59:55Z) - Augmented Knowledge Graph Querying leveraging LLMs [2.5311562666866494]
我々は、知識グラフ(KG)のクエリを強化するフレームワークであるSparqLLMを紹介する。
SparqLLMは、生データからKGを構築するために、Extract, Transform, and Load (ETL)パイプラインを実行する。
また、Large Language Models(LLMs)を利用した自然言語インターフェースを備え、自動SPARQLクエリ生成を実現している。
論文 参考訳(メタデータ) (2025-02-03T12:18:39Z) - ToolACE: Winning the Points of LLM Function Calling [139.07157814653638]
ToolACEは、正確で複雑で多様なツール学習データを生成するように設計された自動エージェントパイプラインである。
我々は、合成データに基づいてトレーニングされたモデルが、8Bパラメータだけで、バークレー・ファンクション・カリング・リーダーボード上で最先端のパフォーマンスを達成することを実証した。
論文 参考訳(メタデータ) (2024-09-02T03:19:56Z) - An Integrated Data Processing Framework for Pretraining Foundation Models [57.47845148721817]
研究者や実践者は、しばしば異なるソースからデータセットを手動でキュレートする必要がある。
本稿では,処理モジュールと解析モジュールを統合したデータ処理フレームワークを提案する。
提案されたフレームワークは使いやすく、柔軟です。
論文 参考訳(メタデータ) (2024-02-26T07:22:51Z) - Trusted Provenance of Automated, Collaborative and Adaptive Data Processing Pipelines [2.186901738997927]
ソリューションアーキテクチャと、Provenance Holderと呼ばれるサービスのコンセプト実装の証明を提供しています。
Provenance Holderは、コラボレーティブで適応的なデータ処理パイプラインを信頼できる方法で実現可能にする。
論文 参考訳(メタデータ) (2023-10-17T17:52:27Z) - Towards Better Dynamic Graph Learning: New Architecture and Unified
Library [29.625205125350313]
DyGFormerは、動的グラフ学習のためのTransformerベースのアーキテクチャである。
DyGLibは、標準のトレーニングパイプラインとコーディングインターフェースを備えた統一ライブラリである。
論文 参考訳(メタデータ) (2023-03-23T05:27:32Z) - A Scalable AutoML Approach Based on Graph Neural Networks [4.723269144709768]
KGpipはAutoMLシステムのサブコンポーネントとして設計されている。
KGpipを2つのAutoMLシステムに統合することで、この能力を実証し、既存の最先端システムの性能を大幅に向上させることを示す。
論文 参考訳(メタデータ) (2021-10-29T20:55:13Z) - Better Call the Plumber: Orchestrating Dynamic Information Extraction
Pipelines [1.7688094977719888]
plumberは、研究コミュニティの無関係なieの取り組みをまとめる最初のフレームワークである。
入力文に基づく最適パイプライン選択の最適化問題について検討する。
本研究は,KG情報抽出パイプラインの動的生成におけるPlumberの有効性を示す。
論文 参考訳(メタデータ) (2021-02-22T13:14:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。