論文の概要: Millions of $\text{GeAR}$-s: Extending GraphRAG to Millions of Documents
- arxiv url: http://arxiv.org/abs/2507.17399v1
- Date: Wed, 23 Jul 2025 10:54:24 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-24 22:33:14.961468
- Title: Millions of $\text{GeAR}$-s: Extending GraphRAG to Millions of Documents
- Title(参考訳): 数百万ドルの$\text{GeAR}$-s: GraphRAGを数百万のドキュメントに拡張
- Authors: Zhili Shen, Chenxin Diao, Pascual Merita, Pavlos Vougiouklis, Jeff Z. Pan,
- Abstract要約: 我々は、最先端のグラフベースのRAGソリューションであるtextGeAR$を採用し、SIGIR 2025 LiveRAG Challengeでそのパフォーマンスを探求することを目指している。
- 参考スコア(独自算出の注目度): 10.933880236559602
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Recent studies have explored graph-based approaches to retrieval-augmented generation, leveraging structured or semi-structured information -- such as entities and their relations extracted from documents -- to enhance retrieval. However, these methods are typically designed to address specific tasks, such as multi-hop question answering and query-focused summarisation, and therefore, there is limited evidence of their general applicability across broader datasets. In this paper, we aim to adapt a state-of-the-art graph-based RAG solution: $\text{GeAR}$ and explore its performance and limitations on the SIGIR 2025 LiveRAG Challenge.
- Abstract(参考訳): 近年,文書から抽出したエンティティや関連性など,構造化情報や半構造化情報を活用した検索強化のためのグラフベースのアプローチが検討されている。
しかしながら、これらの手法は通常、マルチホップ質問応答やクエリ中心の要約といった特定のタスクに対処するために設計されており、より広いデータセットで適用可能であるという証拠は限られている。
本稿では、最先端のグラフベースのRAGソリューションを$\text{GeAR}$に適合させ、SIGIR 2025 LiveRAG Challengeにおけるその性能と制限について検討する。
関連論文リスト
- Clue-RAG: Towards Accurate and Cost-Efficient Graph-based RAG via Multi-Partite Graph and Query-Driven Iterative Retrieval [7.542076325904203]
Retrieval-Augmented Generation (RAG) は、しばしばグラフ構造化データから外部情報を統合することで制限に対処する。
本稿では,マルチパーティグラフインデックスとクエリ駆動反復検索戦略を導入した新しいアプローチであるClue-RAGを提案する。
3つのQAベンチマークの実験により、Clue-RAGは最先端のベースラインを著しく上回っている。
論文 参考訳(メタデータ) (2025-07-11T09:36:45Z) - Graph-based Approaches and Functionalities in Retrieval-Augmented Generation: A Comprehensive Survey [15.60128530639056]
大規模な言語モデル(LLM)は、十分なトレーニングデータと最も更新された知識が不足しているため、推論中に事実エラーに悩まされる。
検索・拡張生成(RAG)はLLMの限界に対処するための有望な解決策として注目されている。
この調査は、RAG内のグラフの機能とパフォーマンス向上への影響について、新たな視点を提供する。
論文 参考訳(メタデータ) (2025-04-08T03:52:05Z) - RGL: A Graph-Centric, Modular Framework for Efficient Retrieval-Augmented Generation on Graphs [58.10503898336799]
完全なRAGパイプラインをシームレスに統合するモジュラーフレームワークであるRAG-on-Graphs Library(RGL)を紹介した。
RGLは、さまざまなグラフフォーマットをサポートし、必須コンポーネントの最適化実装を統合することで、重要な課題に対処する。
評価の結果,RGLはプロトタイピングプロセスの高速化だけでなく,グラフベースRAGシステムの性能や適用性の向上も図っている。
論文 参考訳(メタデータ) (2025-03-25T03:21:48Z) - Optimizing open-domain question answering with graph-based retrieval augmented generation [5.2850605665217865]
我々は,広範囲のクエリータイプにまたがって,グラフベースの検索拡張生成システム (RAG) をベンチマークした。
従来のRAGメソッドは、ニュアンス付きマルチドキュメントタスクの処理に不足することが多い。
本稿では,グラフベースの合成とベクトルベースの検索技術を組み合わせた,費用対効果の高い新しい代替手段TREXを紹介する。
論文 参考訳(メタデータ) (2025-03-04T18:47:17Z) - G-OSR: A Comprehensive Benchmark for Graph Open-Set Recognition [54.45837774534411]
ノードレベルとグラフレベルの両方でグラフオープンセット認識(GOSR)手法を評価するベンチマークである textbfG-OSR を導入する。
結果は、現在のGOSR手法の一般化可能性と限界に関する重要な洞察を与える。
論文 参考訳(メタデータ) (2025-03-01T13:02:47Z) - ArchRAG: Attributed Community-based Hierarchical Retrieval-Augmented Generation [16.204046295248546]
Retrieval-Augmented Generation (RAG) は、外部知識を大規模言語モデル (LLM) に統合するのに有効であることが証明されている。
我々は、Attributed Community-based Hierarchical RAG (ArchRAG)と呼ばれる新しいグラフベースのRAGアプローチを導入する。
属性付きコミュニティのための新しい階層型インデックス構造を構築し,効果的なオンライン検索手法を開発した。
ArchRAGはHuaweiのクラウドコンピューティングにおけるドメイン知識のQAにうまく適用されている。
論文 参考訳(メタデータ) (2025-02-14T03:28:36Z) - Generative Retrieval for Book search [106.67655212825025]
書籍検索のための効率的な生成検索フレームワークを提案する。
データ拡張とアウトライン指向の書籍エンコーディングの2つの主要コンポーネントがある。
プロプライエタリなBaiduデータセットの実験では、GBSが強力なベースラインを上回ることが示されている。
論文 参考訳(メタデータ) (2025-01-19T12:57:13Z) - Retrieval-Augmented Generation with Graphs (GraphRAG) [84.29507404866257]
Retrieval-augmented Generation (RAG) は、追加情報を取得することによって下流タスクの実行を向上させる強力な技術である。
グラフは、その固有の「エッジで接続されたノード」の性質により、巨大な異種情報と関係情報を符号化する。
従来のRAGとは異なり、多種多様な形式とドメイン固有の関係知識のようなグラフ構造化データのユニークさは、異なるドメインでGraphRAGを設計する際、ユニークで重要な課題を生じさせる。
論文 参考訳(メタデータ) (2024-12-31T06:59:35Z) - Deep Graph Anomaly Detection: A Survey and New Perspectives [86.84201183954016]
グラフ異常検出(GAD)は、異常なグラフインスタンス(ノード、エッジ、サブグラフ、グラフ)を特定することを目的とする。
ディープラーニングアプローチ、特にグラフニューラルネットワーク(GNN)は、GADにとって有望なパラダイムとして現れています。
論文 参考訳(メタデータ) (2024-09-16T03:05:11Z) - Graph Retrieval-Augmented Generation: A Survey [28.979898837538958]
Retrieval-Augmented Generation (RAG)は、大規模言語モデル(LLM)の課題に再トレーニングを必要とせずに対処することに成功した。
本稿では,GraphRAGの方法論について概観する。
Graph-Based Indexing、Graph-Guided Retrieval、Graph-Enhanced Generationを含むGraphRAGワークフローを形式化する。
論文 参考訳(メタデータ) (2024-08-15T12:20:24Z) - HybridRAG: Integrating Knowledge Graphs and Vector Retrieval Augmented Generation for Efficient Information Extraction [1.0390583509657403]
本稿では,知識グラフ(KG)に基づくRAG手法のハイブリッドRAG(HybridRAG)を用いた新しい手法を提案する。
ベクトルデータベースとKGの両方からコンテキストを抽出するHybridRAGは、従来のVectorRAGとGraphRAGの両方を個別に比較する。
提案手法は金融分野を超えて応用できる。
論文 参考訳(メタデータ) (2024-08-09T09:07:48Z) - Doc2SoarGraph: Discrete Reasoning over Visually-Rich Table-Text
Documents via Semantic-Oriented Hierarchical Graphs [79.0426838808629]
視覚的にリッチなテーブルテキスト文書に答えるTAT-DQAを提案する。
具体的には、離散推論機能を強化した新しいDoc2SoarGraphフレームワークを提案する。
我々は,TAT-DQAデータセットに関する広範な実験を行い,提案したフレームワークは,テストセット上でのエクサクティマッチ(EM)とF1スコアでそれぞれ17.73%,F1スコアで16.91%の最高のベースラインモデルを上回る結果を得た。
論文 参考訳(メタデータ) (2023-05-03T07:30:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。