論文の概要: GOSU: Retrieval-Augmented Generation with Global-Level Optimized Semantic Unit-Centric Framework
- arxiv url: http://arxiv.org/abs/2509.00449v1
- Date: Sat, 30 Aug 2025 10:44:06 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-04 15:17:03.236314
- Title: GOSU: Retrieval-Augmented Generation with Global-Level Optimized Semantic Unit-Centric Framework
- Title(参考訳): GOSU:グローバルレベル最適化セマンティック単位中心フレームワークによる検索拡張生成
- Authors: Xuecheng Zou, Ke Liu, Bingbing Wang, Huafei Deng, Li Zhang, Yu Tang,
- Abstract要約: 我々は,グローバルな曖昧さを効率的に行う意味単位中心のRAGフレームワークGOSUを提案する。
グラフ構築フェーズでは、GOSUは、ローカルテキストチャンクから抽出したSUをグローバルにマージする。
検索・生成フェーズでは,階層的なキーワード抽出と意味単位の補完を導入する。
- 参考スコア(独自算出の注目度): 9.302778944253566
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Building upon the standard graph-based Retrieval-Augmented Generation (RAG), the introduction of heterogeneous graphs and hypergraphs aims to enrich retrieval and generation by leveraging the relationships between multiple entities through the concept of semantic units (SUs). But this also raises a key issue: The extraction of high-level SUs limited to local text chunks is prone to ambiguity, complex coupling, and increased retrieval overhead due to the lack of global knowledge or the neglect of fine-grained relationships. To address these issues, we propose GOSU, a semantic unit-centric RAG framework that efficiently performs global disambiguation and utilizes SUs to capture interconnections between different nodes across the global context. In the graph construction phase, GOSU performs global merging on the pre-extracted SUs from local text chunks and guides entity and relationship extraction, reducing the difficulty of coreference resolution while uncovering global semantic objects across text chunks. In the retrieval and generation phase, we introduce hierarchical keyword extraction and semantic unit completion. The former uncovers the fine-grained binary relationships overlooked by the latter, while the latter compensates for the coarse-grained n-ary relationships missing from the former. Evaluation across multiple tasks demonstrates that GOSU outperforms the baseline RAG methods in terms of generation quality.
- Abstract(参考訳): 標準的なグラフベースのRetrieval-Augmented Generation(RAG)を基盤として、異種グラフとハイパーグラフの導入は、セマンティック・ユニット(SU)の概念を通じて複数のエンティティ間の関係を活用することにより、検索と生成を強化することを目的としている。
局所的なテキストチャンクに制限された高レベルのSUの抽出は、グローバルな知識の欠如やきめ細かい関係の無視による曖昧さ、複雑な結合、検索オーバーヘッドの増加につながる。
これらの問題に対処するために,GOSUを提案する。GOSUは,グローバルな曖昧さを効果的に実現し,SUを用いてグローバルなコンテキストをまたいだ異なるノード間の相互接続をキャプチャするセマンティックユニット中心のRAGフレームワークである。
グラフ構築段階では、GOSUは、ローカルテキストチャンクから抽出したSUに対してグローバルマージを行い、エンティティと関係抽出をガイドし、テキストチャンク全体にわたるグローバルセマンティックオブジェクトを発見しながら、コア参照解決の難しさを軽減する。
検索・生成フェーズでは,階層的なキーワード抽出と意味単位の補完を導入する。
前者は後者が見落としている細粒な二項関係を明らかにし、後者は前者から欠落した粗粒のn-項関係を補う。
複数のタスクに対する評価は、GOSUが生成品質の点でベースラインRAGメソッドよりも優れていることを示している。
関連論文リスト
- Cross-Granularity Hypergraph Retrieval-Augmented Generation for Multi-hop Question Answering [49.43814054718318]
マルチホップ質問応答 (MHQA) は、正しい回答を得るために複数の経路に散在する知識を統合する必要がある。
従来の検索拡張生成法(RAG)は主に粗い粒度のテキスト意味的類似性に焦点を当てている。
本稿では,HGRAG for MHQAという新しいRAG手法を提案する。
論文 参考訳(メタデータ) (2025-08-15T06:36:13Z) - LeanRAG: Knowledge-Graph-Based Generation with Semantic Aggregation and Hierarchical Retrieval [10.566901995776025]
LeanRAGは知識集約と検索戦略を組み合わせたフレームワークです。
グラフ上のパス検索に関連するかなりのオーバーヘッドを軽減し、冗長な情報検索を最小限にする。
論文 参考訳(メタデータ) (2025-08-14T06:47:18Z) - Unleashing the Potential of Text-attributed Graphs: Automatic Relation Decomposition via Large Language Models [31.443478448031886]
RoSE (Relation-oriented Semantic Edge-Decomposition) は、生のテキスト属性を分析してグラフ構造を分解する新しいフレームワークである。
我々のフレームワークは、さまざまなデータセットのノード分類性能を大幅に向上させ、ウィスコンシンデータセットでは最大16%の改善を実現した。
論文 参考訳(メタデータ) (2024-05-28T20:54:47Z) - Spatial Semantic Recurrent Mining for Referring Image Segmentation [63.34997546393106]
高品質なクロスモーダリティ融合を実現するために,Stextsuperscript2RMを提案する。
これは、言語特徴の分散、空間的意味的再帰的分離、パーセマンティック・セマンティック・バランシングという三部作の作業戦略に従う。
提案手法は他の最先端アルゴリズムに対して好適に機能する。
論文 参考訳(メタデータ) (2024-05-15T00:17:48Z) - From Local to Global: A Graph RAG Approach to Query-Focused Summarization [4.075260785658849]
GraphRAGは、プライベートテキストコーパスに対する質問応答のためのグラフベースのアプローチである。
我々は,GraphRAGが従来のRAGベースラインよりも大幅に改善され,生成した回答の包括性と多様性が向上することを示す。
論文 参考訳(メタデータ) (2024-04-24T18:38:11Z) - UGMAE: A Unified Framework for Graph Masked Autoencoders [67.75493040186859]
グラフマスク付きオートエンコーダのための統一フレームワークであるUGMAEを提案する。
まず,ノードの特異性を考慮した適応型特徴マスク生成器を開発した。
次に,階層型構造再構成と特徴再構成を併用し,総合的なグラフ情報を取得する。
論文 参考訳(メタデータ) (2024-02-12T19:39:26Z) - GUESR: A Global Unsupervised Data-Enhancement with Bucket-Cluster
Sampling for Sequential Recommendation [58.6450834556133]
本研究では,グローバルな視点から複雑な関連性を持つ項目表現を強化するために,グラフコントラスト学習を提案する。
本稿では,CapsNetモジュールを拡張したターゲットアテンション機構により,ユーザの動的嗜好を導出する。
提案したGUESRは,大幅な改善を達成できただけでなく,汎用的な拡張戦略ともみなすことができた。
論文 参考訳(メタデータ) (2023-03-01T05:46:36Z) - Graph Representation Learning via Contrasting Cluster Assignments [57.87743170674533]
GRCCAと呼ばれるクラスタ割り当てを対比して、教師なしグラフ表現モデルを提案する。
クラスタリングアルゴリズムとコントラスト学習を組み合わせることで、局所的およびグローバルな情報を合成的にうまく活用する動機付けがある。
GRCCAは、ほとんどのタスクにおいて強力な競争力を持っている。
論文 参考訳(メタデータ) (2021-12-15T07:28:58Z) - Universal-RCNN: Universal Object Detector via Transferable Graph R-CNN [117.80737222754306]
我々はUniversal-RCNNと呼ばれる新しいユニバーサルオブジェクト検出器を提案する。
まず、すべてのカテゴリの高レベルなセマンティック表現を統合することで、グローバルなセマンティックプールを生成する。
ドメイン内推論モジュールは、空間認識GCNによってガイドされる1つのデータセット内のスパースグラフ表現を学習し、伝播する。
論文 参考訳(メタデータ) (2020-02-18T07:57:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。