論文の概要: HybGRAG: Hybrid Retrieval-Augmented Generation on Textual and Relational Knowledge Bases
- arxiv url: http://arxiv.org/abs/2412.16311v1
- Date: Fri, 20 Dec 2024 19:49:12 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-12-24 16:01:10.340626
- Title: HybGRAG: Hybrid Retrieval-Augmented Generation on Textual and Relational Knowledge Bases
- Title(参考訳): HybGRAG: テキスト・リレーショナル知識ベースに基づくハイブリッド検索型検索生成
- Authors: Meng-Chieh Lee, Qi Zhu, Costas Mavromatis, Zhen Han, Soji Adeshina, Vassilis N. Ioannidis, Huzefa Rangwala, Christos Faloutsos,
- Abstract要約: 本稿では,レトリバーバンクと批評家モジュールからなるHQA用HybGRAGについて,次のような利点がある。
STaRKベンチマークの実験では、HybGRAGはパフォーマンスが大幅に向上し、hit@1の平均相対的な改善は51%である。
- 参考スコア(独自算出の注目度): 36.46450059250384
- License:
- Abstract: Given a semi-structured knowledge base (SKB), where text documents are interconnected by relations, how can we effectively retrieve relevant information to answer user questions? Retrieval-Augmented Generation (RAG) retrieves documents to assist large language models (LLMs) in question answering; while Graph RAG (GRAG) uses structured knowledge bases as its knowledge source. However, many questions require both textual and relational information from SKB - referred to as "hybrid" questions - which complicates the retrieval process and underscores the need for a hybrid retrieval method that leverages both information. In this paper, through our empirical analysis, we identify key insights that show why existing methods may struggle with hybrid question answering (HQA) over SKB. Based on these insights, we propose HybGRAG for HQA consisting of a retriever bank and a critic module, with the following advantages: (1) Agentic, it automatically refines the output by incorporating feedback from the critic module, (2) Adaptive, it solves hybrid questions requiring both textual and relational information with the retriever bank, (3) Interpretable, it justifies decision making with intuitive refinement path, and (4) Effective, it surpasses all baselines on HQA benchmarks. In experiments on the STaRK benchmark, HybGRAG achieves significant performance gains, with an average relative improvement in Hit@1 of 51%.
- Abstract(参考訳): テキスト文書が関係によって相互接続される半構造化知識ベース(SKB)を前提として、ユーザからの質問に答えるために、どのように効率的に関連情報を検索できるか。
Retrieval-Augmented Generation (RAG) は大きな言語モデル (LLM) を支援する文書を検索するが、Graph RAG (GRAG) は構造化知識ベースをその知識源としている。
しかし、多くの質問は、SKB("ハイブリッド"質問と呼ばれる)からのテキスト情報とリレーショナル情報の両方を必要とし、検索プロセスを複雑にし、両方の情報を活用するハイブリッド検索方法の必要性を浮き彫りにしている。
本稿では,SKB 上のハイブリッド質問応答 (HQA) に既存の手法が苦労する理由を示す重要な知見を実証分析により明らかにする。
これらの知見に基づき、検索者バンクと批評家モジュールからなるHQAのHybGRAGを提案し、(1)評価モジュールからのフィードバックを取り入れて自動的に出力を洗練し、(2)適応的に、検索者バンクとテキスト・リレーショナル情報の両方を必要とするハイブリッド質問を解消し、(3)解釈し、直感的な洗練パスで意思決定を正当化し、(4)有効にHQAベンチマークのベースラインを全て越えます。
STaRKベンチマークの実験では、HybGRAGはパフォーマンスが大幅に向上し、hit@1の平均相対的な改善は51%である。
関連論文リスト
- Hybrid-SQuAD: Hybrid Scholarly Question Answering Dataset [8.867885891794877]
我々は,新しい大規模Scholarly Question AnsweringデータセットであるHybrid-SQuADを紹介する。
データセットは、大きな言語モデルによって生成される10.5Kの質問応答ペアで構成されている。
RAGベースのベースラインハイブリッドQAモデルを提案し、Hybrid-SQuADテストセット上で69.65の正確な一致スコアを達成する。
論文 参考訳(メタデータ) (2024-12-03T19:37:00Z) - Retriever-and-Memory: Towards Adaptive Note-Enhanced Retrieval-Augmented Generation [72.70046559930555]
本稿では,複雑なQAタスクに対する適応ノート拡張RAG(Adaptive Note-Enhanced RAG)と呼ばれる汎用RAGアプローチを提案する。
具体的には、Adaptive-Noteは、知識の成長に関する包括的な視点を導入し、ノート形式で新しい情報を反復的に収集する。
さらに,適切な知識探索を促進するために,適応的な音符ベースの停止探索戦略を用いて,「何を検索し,いつ停止するか」を判断する。
論文 参考訳(メタデータ) (2024-10-11T14:03:29Z) - Enhancing Retrieval and Managing Retrieval: A Four-Module Synergy for Improved Quality and Efficiency in RAG Systems [14.62114319247837]
Retrieval-augmented Generation (RAG)技術は、大規模言語モデル(LLM)のコンテキスト内学習機能を利用して、より正確で関連する応答を生成する。
重要なコンポーネントであるQuery Rewriterモジュールは、検索フレンドリーなクエリを生成することで知識検索を強化する。
これら4つのRAGモジュールは、RAGシステムの応答品質と効率を相乗的に改善する。
論文 参考訳(メタデータ) (2024-07-15T12:35:00Z) - STaRK: Benchmarking LLM Retrieval on Textual and Relational Knowledge Bases [93.96463520716759]
テキストと知識ベースを用いた大規模半構造検索ベンチマークSTARKを開発した。
本ベンチマークでは, 製品検索, 学術論文検索, 精密医療におけるクエリの3分野について検討した。
多様なリレーショナル情報と複雑なテキスト特性を統合した,現実的なユーザクエリを合成する,新しいパイプラインを設計する。
論文 参考訳(メタデータ) (2024-04-19T22:54:54Z) - Selecting Query-bag as Pseudo Relevance Feedback for Information-seeking Conversations [76.70349332096693]
情報検索対話システムは電子商取引システムで広く利用されている。
クエリバッグに基づくPseudo Relevance Feedback framework(QB-PRF)を提案する。
関連クエリを備えたクエリバッグを構築し、擬似シグナルとして機能し、情報検索の会話をガイドする。
論文 参考訳(メタデータ) (2024-03-22T08:10:32Z) - DIVKNOWQA: Assessing the Reasoning Ability of LLMs via Open-Domain
Question Answering over Knowledge Base and Text [73.68051228972024]
大きな言語モデル(LLM)は印象的な生成能力を示すが、内部知識に依存すると幻覚に悩まされる。
検索拡張LDMは、外部知識においてLLMを基盤とする潜在的な解決策として出現している。
論文 参考訳(メタデータ) (2023-10-31T04:37:57Z) - ChatKBQA: A Generate-then-Retrieve Framework for Knowledge Base Question Answering with Fine-tuned Large Language Models [19.85526116658481]
本稿では,新規かつ簡易な生成検索KBQAフレームワークであるChatKBQAを紹介する。
実験の結果,ChatKBQAは標準KBQAデータセット上で新たな最先端性能を実現することがわかった。
この研究は、LLMと知識グラフを組み合わせるための新しいパラダイムとして、解釈可能および知識要求型質問応答のパラダイムと見なすこともできる。
論文 参考訳(メタデータ) (2023-10-13T09:45:14Z) - EQG-RACE: Examination-Type Question Generation [21.17100754955864]
本論文では, RACEから抽出したデータセットをもとに, 試験型質問生成手法 (EQG-RACE) を提案する。
EQG-RACEでは、離散的な回答情報を扱うための2つの主要な戦略と、長い文脈における推論が採用されています。
実験結果は、ベースラインよりも優れたEQG-RACEの最先端の性能を示しています。
論文 参考訳(メタデータ) (2020-12-11T03:52:17Z) - A Survey on Complex Question Answering over Knowledge Base: Recent
Advances and Challenges [71.4531144086568]
知識ベース(KB)に対する質問回答(QA)は、自然言語の質問に自動的に答えることを目的としている。
研究者は、よりKBのトリプルと制約推論を必要とする単純な質問から複雑な質問へと注意を移した。
論文 参考訳(メタデータ) (2020-07-26T07:13:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。