論文の概要: Schema Matching on Graph: Iterative Graph Exploration for Efficient and Explainable Data Integration
- arxiv url: http://arxiv.org/abs/2511.20285v2
- Date: Mon, 01 Dec 2025 06:02:11 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-02 15:37:38.327685
- Title: Schema Matching on Graph: Iterative Graph Exploration for Efficient and Explainable Data Integration
- Title(参考訳): グラフ上のスキーママッチング: 効率的で説明可能なデータ統合のための反復的なグラフ探索
- Authors: Mingyu Jeon, Jaeyoung Suh, Suwan Cho,
- Abstract要約: 大規模言語モデル(LLM)はスキーママッチングにおいて有望であるが、幻覚と最新のドメイン知識の欠如に悩まされている。
本稿では,単純な1ホップSPARQLクエリの反復実行を利用する新しいフレームワークであるSMoG(Matching on Graph)を紹介する。
実世界の医療データセットの実験結果は、SMoGが最先端のベースラインに匹敵するパフォーマンスを達成することを示した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Schema matching is a critical task in data integration, particularly in the medical domain where disparate Electronic Health Record (EHR) systems must be aligned to standard models like OMOP CDM. While Large Language Models (LLMs) have shown promise in schema matching, they suffer from hallucination and lack of up-to-date domain knowledge. Knowledge Graphs (KGs) offer a solution by providing structured, verifiable knowledge. However, existing KG-augmented LLM approaches often rely on inefficient complex multi-hop queries or storage-intensive vector-based retrieval methods. This paper introduces SMoG (Schema Matching on Graph), a novel framework that leverages iterative execution of simple 1-hop SPARQL queries, inspired by successful strategies in Knowledge Graph Question Answering (KGQA). SMoG enhances explainability and reliability by generating human-verifiable query paths while significantly reducing storage requirements by directly querying SPARQL endpoints. Experimental results on real-world medical datasets demonstrate that SMoG achieves performance comparable to state-of-the-art baselines, validating its effectiveness and efficiency in KG-augmented schema matching.
- Abstract(参考訳): スキーママッチングは、特に異種電子健康記録(EHR)システムがOMOP CDMのような標準モデルに準拠しなければならない医療領域において、データ統合において重要なタスクである。
大規模言語モデル(LLM)はスキーママッチングにおいて有望であるが、幻覚と最新のドメイン知識の欠如に悩まされている。
知識グラフ(KG)は、構造化された検証可能な知識を提供することによって、ソリューションを提供する。
しかし、既存の KG 拡張 LLM アプローチは、しばしば非効率な複雑なマルチホップクエリやストレージ集約ベクトルベースの検索手法に依存している。
本稿では,SMOG(Schema Matching on Graph)について紹介する。これは,知識グラフ質問回答(KGQA)の成功戦略に触発された,単純な1ホップSPARQLクエリの反復実行を活用する新しいフレームワークである。
SMoGは、人間が検証可能なクエリパスを生成することによって説明可能性と信頼性を高め、SPARQLエンドポイントを直接クエリすることでストレージ要件を著しく削減する。
実世界の医療データセットを用いた実験の結果、SMoGは最先端のベースラインに匹敵する性能を達成し、KG拡張スキーママッチングの有効性と効率を検証した。
関連論文リスト
- GRIP: In-Parameter Graph Reasoning through Fine-Tuning Large Language Models [40.5886835740214]
大規模言語モデル(LLM)は、逐次テキストデータのモデリングにおいて顕著な能力を示した。
グラフから複雑な関係情報を内部化できる新しいフレームワークGRIPを提案する。
この知識は軽量な LoRA パラメータに効率的に格納され、微調整された LLM が幅広いグラフ関連タスクを実行できる。
論文 参考訳(メタデータ) (2025-11-06T21:56:58Z) - Search-on-Graph: Iterative Informed Navigation for Large Language Model Reasoning on Knowledge Graphs [26.0585592684229]
大規模言語モデル(LLM)は、知識集約型マルチホップ質問では信頼性が保たれていない印象的な推論能力を示している。
本稿では,LLMの反復的なグラフナビゲーションを実現するための,シンプルかつ効果的なフレームワークである検索オングラフ(SoG)を提案する。
Wikidataベンチマーク(以前のベストメソッドよりも+16%改善)とFreebaseベンチマークの一貫性のある改善は特に顕著です。
論文 参考訳(メタデータ) (2025-10-09T21:20:16Z) - G-reasoner: Foundation Models for Unified Reasoning over Graph-structured Knowledge [88.82814893945077]
大規模言語モデル(LLM)は複雑な推論において優れているが、静的かつ不完全なパラメトリック知識によって制限される。
最近のグラフ強化RAG (GraphRAG) は、このギャップを補足したグラフを構築し、LLMがそれらを推論できるようにする。
G-reasonerは、様々なグラフ構造化知識を推論するためにグラフと言語基盤モデルを統合した統合フレームワークである。
論文 参考訳(メタデータ) (2025-09-29T04:38:12Z) - Enrich-on-Graph: Query-Graph Alignment for Complex Reasoning with LLM Enriching [61.824094419641575]
大言語モデル(LLM)は知識グラフ質問応答(KGQA)のような知識集約的なシナリオにおける幻覚と事実的誤りに苦しむ
これは、構造化知識グラフ(KG)と非構造化クエリのセマンティックギャップによるもので、その焦点や構造に固有の違いが原因である。
既存の手法は通常、バニラKGの資源集約的で非スケーリング可能な推論を用いるが、このギャップを見落としている。
我々は、LLMの事前知識を活用してKGを充実させる柔軟なフレームワークEnrich-on-Graph(EoG)を提案し、グラフとクエリ間のセマンティックギャップを埋める。
論文 参考訳(メタデータ) (2025-09-25T06:48:52Z) - GRIL: Knowledge Graph Retrieval-Integrated Learning with Large Language Models [59.72897499248909]
本稿では,Large Language Models (LLM) を用いたエンドツーエンド学習のための新しいグラフ検索手法を提案する。
抽出したサブグラフでは, 構造的知識と意味的特徴をそれぞれ軟式トークンと言語化グラフで符号化し, LLMに注入する。
提案手法は、複雑な推論タスクに対する結合グラフ-LLM最適化の強みを検証し、最先端の性能を一貫して達成する。
論文 参考訳(メタデータ) (2025-09-20T02:38:00Z) - Learning Efficient and Generalizable Graph Retriever for Knowledge-Graph Question Answering [75.12322966980003]
大規模言語モデル(LLM)は、様々な領域にわたって強い帰納的推論能力を示している。
既存のRAGパイプラインのほとんどは非構造化テキストに依存しており、解釈可能性と構造化推論を制限する。
近年,知識グラフ解答のための知識グラフとLLMの統合について検討している。
KGQAにおける効率的なグラフ検索のための新しいフレームワークであるRAPLを提案する。
論文 参考訳(メタデータ) (2025-06-11T12:03:52Z) - Divide by Question, Conquer by Agent: SPLIT-RAG with Question-Driven Graph Partitioning [62.640169289390535]
SPLIT-RAGは、質問駆動セマンティックグラフ分割と協調サブグラフ検索による制限に対処するマルチエージェントRAGフレームワークである。
革新的なフレームワークは、まずリンク情報のセマンティック分割を作成し、次にタイプ特化知識ベースを使用してマルチエージェントRAGを実現する。
属性対応グラフセグメンテーションは、知識グラフを意味的に一貫性のあるサブグラフに分割し、サブグラフが異なるクエリタイプと整合することを保証する。
階層的なマージモジュールは、論理的検証を通じて、部分グラフ由来の解答間の矛盾を解消する。
論文 参考訳(メタデータ) (2025-05-20T06:44:34Z) - Knowledge Graph-based Retrieval-Augmented Generation for Schema Matching [3.7548609506798485]
本稿では,大規模言語モデル(LLM)マッチングのための知識グラフに基づく検索型生成モデルを提案する。
特に、KG-RAG4SMはベクトルベース、グラフベース、クエリベースのグラフ検索を導入している。
KG-RAG4SMは、MIMICデータセットの精度とF1スコアにおいて、最先端(SOTA)法を35.89%、30.50%で上回っている。
論文 参考訳(メタデータ) (2025-01-15T09:32:37Z) - Matchmaker: Self-Improving Large Language Model Programs for Schema Matching [60.23571456538149]
本稿では,スキーママッチングのための合成言語モデルプログラムを提案する。
Matchmakerは、ラベル付きデモを必要とせずに、ゼロショットで自己改善する。
実証的に、Matchmakerが以前のMLベースのアプローチより優れている実世界の医療スキーママッチングベンチマークを実証する。
論文 参考訳(メタデータ) (2024-10-31T16:34:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。