論文の概要: EHRAG: Bridging Semantic Gaps in Lightweight GraphRAG via Hybrid Hypergraph Construction and Retrieval
- arxiv url: http://arxiv.org/abs/2604.17458v2
- Date: Tue, 21 Apr 2026 06:43:15 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-22 14:04:47.92424
- Title: EHRAG: Bridging Semantic Gaps in Lightweight GraphRAG via Hybrid Hypergraph Construction and Retrieval
- Title(参考訳): EHRAG:ハイブリッドハイパーグラフ構築と検索による軽量グラフRAGのセマンティックギャップのブリッジ化
- Authors: Yifan Song, Xingjian Tao, Zhicheng Yang, Yihong Luo, Jing Tang,
- Abstract要約: 本稿では,構造レベルと意味レベルの関係を捉えるハイパーグラフを構築する軽量なRAGフレームワーク EHRAGを提案する。
EHRAGは、トピック対応スコアリングとパーソナライズされたページランク(PPR)リファインメントを備えた構造-セマンティックハイブリッド拡散を行う。
EHRAGは、線形インデックス化の複雑さとトークン消費のゼロを維持しながら、最先端のベースラインを上回っている。
- 参考スコア(独自算出の注目度): 18.623178248262032
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Graph-based Retrieval-Augmented Generation (GraphRAG) enhances LLMs by structuring corpus into graphs to facilitate multi-hop reasoning. While recent lightweight approaches reduce indexing costs by leveraging Named Entity Recognition (NER), they rely strictly on structural co-occurrence, failing to capture latent semantic connections between disjoint entities. To address this, we propose EHRAG, a lightweight RAG framework that constructs a hypergraph capturing both structure and semantic level relationships, employing a hybrid structural-semantic retrieval mechanism. Specifically, EHRAG constructs structural hyperedges based on sentence-level co-occurrence with lightweight entity extraction and semantic hyperedges by clustering entity text embeddings, ensuring the hypergraph encompasses both structural and semantic information. For retrieval, EHRAG performs a structure-semantic hybrid diffusion with topic-aware scoring and personalized pagerank (PPR) refinement to identify the top-k relevant documents. Experiments on four datasets show that EHRAG outperforms state-of-the-art baselines while maintaining linear indexing complexity and zero token consumption for construction. Code is available at https://github.com/yfsong00/EHRAG.
- Abstract(参考訳): グラフベースのRetrieval-Augmented Generation (GraphRAG)は、コーパスをグラフに構造化することでLLMを強化し、マルチホップ推論を容易にする。
最近の軽量なアプローチでは、名前付きエンティティ認識(NER)を活用することでインデックス作成コストが削減されているが、構造的共起に厳密に依存しており、非結合エンティティ間の潜時的なセマンティック接続をキャプチャできない。
そこで本研究では,構造レベルの関係と意味レベルの関係をキャプチャするハイパーグラフを構築する軽量なRAGフレームワーク EHRAG を提案する。
具体的には、EHRAGは、エンティティテキストの埋め込みをクラスタリングすることで、軽量なエンティティ抽出とセマンティックハイパーエッジによる文レベルの共起に基づく構造的ハイパーエッジを構築し、ハイパーグラフが構造的情報と意味的情報の両方を包含することを保証する。
EHRAGは、トピック対応スコアリングとパーソナライズされたページランク(PPR)リファインメントを備えた構造意味ハイブリッド拡散を行い、トップk関連文書を識別する。
4つのデータセットの実験では、EHRAGは線形インデックス化の複雑さと建設のためのトークン消費のゼロを維持しながら、最先端のベースラインを上回っている。
コードはhttps://github.com/yfsong00/EHRAGで入手できる。
関連論文リスト
- From Flat to Structural: Enhancing Automated Short Answer Grading with GraphRAG [8.449978933501965]
本稿では,参照資料を構造化知識グラフに整理するグラフ検索拡張生成(GraphRAG)フレームワークを提案する。
提案手法では,高忠実度グラフ構築のためのMicrosoft GraphRAGとHippoRAGニューロシンボリックアルゴリズムの2相パイプラインを用いる。
論文 参考訳(メタデータ) (2026-02-28T04:44:06Z) - Graph-Anchored Knowledge Indexing for Retrieval-Augmented Generation [53.42323544075114]
グラフアンコール型知識インデックス手法であるGraphAnchorを提案する。
4つのマルチホップ質問応答ベンチマークの実験では、GraphAnchorの有効性が示されている。
論文 参考訳(メタデータ) (2026-01-23T05:41:05Z) - GRACE: Graph-Guided Repository-Aware Code Completion through Hierarchical Code Fusion [33.66085762717581]
LLMはローカライズされたコード補完に優れていますが、コンテキストウィンドウが限られているため、リポジトリレベルのタスクに苦労しています。
GRACEは、静的および動的コードセマンティクスの両方をキャプチャするために、マルチレベルでマルチセマンティックなコードグラフを構築する。
実験によると、GRACEはすべてのメトリクスで最先端のメソッドよりも大幅に優れています。
論文 参考訳(メタデータ) (2025-09-07T09:01:48Z) - Cross-Granularity Hypergraph Retrieval-Augmented Generation for Multi-hop Question Answering [49.43814054718318]
マルチホップ質問応答 (MHQA) は、正しい回答を得るために複数の経路に散在する知識を統合する必要がある。
従来の検索拡張生成法(RAG)は主に粗い粒度のテキスト意味的類似性に焦点を当てている。
本稿では,HGRAG for MHQAという新しいRAG手法を提案する。
論文 参考訳(メタデータ) (2025-08-15T06:36:13Z) - BifrostRAG: Bridging Dual Knowledge Graphs for Multi-Hop Question Answering in Construction Safety [11.079426930790458]
多くのコンプライアンス関連のクエリはマルチホップであり、リンクされた節間で情報を合成する必要がある。
これは、従来の検索拡張世代(RAG)システムにとっての課題である。
本稿では、言語関係と文書構造の両方を明示的にモデル化した二重グラフRAG統合システムであるBifrostRAGを紹介する。
論文 参考訳(メタデータ) (2025-07-18T03:39:14Z) - SlimRAG: Retrieval without Graphs via Entity-Aware Context Selection [38.200971604630524]
SlimRAGはグラフのない検索のための軽量フレームワークである。
構造が重いコンポーネントを、シンプルで効果的なエンティティ認識メカニズムで置き換える。
実験により、SlimRAGは強い平坦線とグラフベースのベースラインよりも精度が高いことが示された。
論文 参考訳(メタデータ) (2025-06-15T15:36:17Z) - Respecting Temporal-Causal Consistency: Entity-Event Knowledge Graphs for Retrieval-Augmented Generation [69.45495166424642]
我々は,物語文書における時間的,因果的,文字的整合性を理解するために,頑健で差別的なQAベンチマークを開発する。
次に、バイナリマッピングでリンクされたエンティティとイベントのサブグラフを分離したまま保持するデュアルグラフフレームワークであるEntity-Event RAG(E2RAG)を紹介します。
ChronoQA全体で、我々のアプローチは最先端の非構造化およびKGベースのRAGベースラインよりも優れており、因果一貫性クエリや文字整合性クエリが顕著である。
論文 参考訳(メタデータ) (2025-06-06T10:07:21Z) - Divide by Question, Conquer by Agent: SPLIT-RAG with Question-Driven Graph Partitioning [62.640169289390535]
SPLIT-RAGは、質問駆動セマンティックグラフ分割と協調サブグラフ検索による制限に対処するマルチエージェントRAGフレームワークである。
革新的なフレームワークは、まずリンク情報のセマンティック分割を作成し、次にタイプ特化知識ベースを使用してマルチエージェントRAGを実現する。
属性対応グラフセグメンテーションは、知識グラフを意味的に一貫性のあるサブグラフに分割し、サブグラフが異なるクエリタイプと整合することを保証する。
階層的なマージモジュールは、論理的検証を通じて、部分グラフ由来の解答間の矛盾を解消する。
論文 参考訳(メタデータ) (2025-05-20T06:44:34Z) - Graph Structure Refinement with Energy-based Contrastive Learning [56.957793274727514]
グラフの構造と表現を学習するための生成訓練と識別訓練のジョイントに基づく教師なし手法を提案する。
本稿では,ECL-GSR(Energy-based Contrastive Learning)によるグラフ構造再構成(GSR)フレームワークを提案する。
ECL-GSRは、主要なベースラインに対するサンプルやメモリの少ない高速なトレーニングを実現し、下流タスクの単純さと効率性を強調している。
論文 参考訳(メタデータ) (2024-12-20T04:05:09Z) - Hypergraph based Understanding for Document Semantic Entity Recognition [65.84258776834524]
我々は,ハイパグラフアテンションを利用したハイパグラフアテンション文書セマンティックエンティティ認識フレームワークHGAを構築し,エンティティ境界とエンティティカテゴリを同時に重視する。
FUNSD, CORD, XFUNDIE で得られた結果は,本手法が意味的エンティティ認識タスクの性能を効果的に向上できることを示す。
論文 参考訳(メタデータ) (2024-07-09T14:35:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。