論文の概要: HF-RAG: Hierarchical Fusion-based RAG with Multiple Sources and Rankers
- arxiv url: http://arxiv.org/abs/2509.02837v1
- Date: Tue, 02 Sep 2025 21:03:40 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-04 21:40:46.343431
- Title: HF-RAG: Hierarchical Fusion-based RAG with Multiple Sources and Rankers
- Title(参考訳): HF-RAG:複数ソースとランカを持つ階層型核融合型RAG
- Authors: Payel Santra, Madhusudan Ghosh, Debasis Ganguly, Partha Basuchowdhuri, Sudip Kumar Naskar,
- Abstract要約: ラベル付きおよびラベルなしデータの活用は、検索拡張生成において相補的な利点をもたらす可能性がある。
これらの異種源からの証拠を結合する手法を提案する。
事実検証タスクに対する我々のアプローチを評価し、最も優れた個人ランキングや情報源よりも一貫して改善されていることを実証する。
- 参考スコア(独自算出の注目度): 9.867003380698238
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Leveraging both labeled (input-output associations) and unlabeled data (wider contextual grounding) may provide complementary benefits in retrieval augmented generation (RAG). However, effectively combining evidence from these heterogeneous sources is challenging as the respective similarity scores are not inter-comparable. Additionally, aggregating beliefs from the outputs of multiple rankers can improve the effectiveness of RAG. Our proposed method first aggregates the top-documents from a number of IR models using a standard rank fusion technique for each source (labeled and unlabeled). Next, we standardize the retrieval score distributions within each source by applying z-score transformation before merging the top-retrieved documents from the two sources. We evaluate our approach on the fact verification task, demonstrating that it consistently improves over the best-performing individual ranker or source and also shows better out-of-domain generalization.
- Abstract(参考訳): ラベル付き(インプット・アウトプット・アソシエーション)とラベルなし(より広義の文脈的基盤)の両方を活用することは、検索拡張生成(RAG)において相補的な利点をもたらす可能性がある。
しかしながら、これらの異種源からのエビデンスを効果的に組み合わせることは、それぞれの類似度スコアが相互に比較できないため困難である。
さらに、複数のランクの出力から信念を集約することで、RAGの有効性を向上させることができる。
提案手法は、まず複数のIRモデルから、各ソース(ラベル付きおよびラベルなし)の標準階調融合技術を用いて、トップドキュメントを集約する。
次に、各ソース内の検索スコア分布をzスコア変換を適用して標準化し、2つのソースから取得した上位文書をマージする。
提案手法は,最も優れた個人ランキングや情報源よりも一貫して改善され,ドメイン外の一般化も向上していることを示し,事実検証タスクに対するアプローチを評価する。
関連論文リスト
- UniversalRAG: Retrieval-Augmented Generation over Corpora of Diverse Modalities and Granularities [53.76854299076118]
UniversalRAGは異種情報源からの知識を多様さと粒度で検索・統合するための新しいRAGフレームワークである。
本稿では,最も適切なモダリティ固有コーパスを動的に識別し,その内部でターゲット検索を行うモダリティ対応ルーティング機構を提案する。
マルチモーダル性にまたがる8つのベンチマークでUniversalRAGを検証する。
論文 参考訳(メタデータ) (2025-04-29T13:18:58Z) - Improving Generated and Retrieved Knowledge Combination Through Zero-shot Generation [41.43397783169612]
オープンドメイン質問回答(QA)は,大規模言語モデル(LLM)による忠実に検索されたパスと関連するパスを組み合わせることで,かなりの関心を集めている。
これらの知識の源と組み合わせるための明確なラベルが不足している。
本稿では,検索したパスとLLM生成したパスの両方に対して,再格付け手法を利用したBi-Re rank for Merging Generated and Retrieved Knowledge (BRMGR)を提案する。
論文 参考訳(メタデータ) (2024-12-25T06:40:36Z) - Attention with Dependency Parsing Augmentation for Fine-Grained Attribution [26.603281615221505]
提案手法は,検索した文書から各回答に対する証拠を裏付ける,きめ細かな属性機構を開発する。
既存の属性法は、応答と文書間のモデル-内部類似度(Saliency scores)や隠れ状態類似度(hidden state similarity)など)に依存している。
まず,表現の粒度を保ちつつ,集合ユニオン操作を通じてトークンに関する証拠を集約する。
第二に、ターゲットスパンの意味的完全性を強化するために依存性解析を統合することで属性の強化を行う。
論文 参考訳(メタデータ) (2024-12-16T03:12:13Z) - SiReRAG: Indexing Similar and Related Information for Multihop Reasoning [96.60045548116584]
SiReRAGは、類似情報と関連する情報の両方を明示的に考慮する新しいRAGインデックス方式である。
SiReRAGは、3つのマルチホップデータセットの最先端インデックス手法を一貫して上回る。
論文 参考訳(メタデータ) (2024-12-09T04:56:43Z) - Retrieval-Augmented Generation with Estimation of Source Reliability [17.017833281143297]
Reliability-Aware RAG (RA-RAG) は複数のソースの信頼性を推定し、この情報を検索プロセスと集約プロセスの両方に組み込む。
異質なソース信頼性を持つ実世界のシナリオを反映したベンチマークを導入する。
論文 参考訳(メタデータ) (2024-10-30T12:09:29Z) - Towards Fair RAG: On the Impact of Fair Ranking in Retrieval-Augmented Generation [53.285436927963865]
本論文は,公正度を意識したランキングを組み込んだRAGシステムの最初の体系的評価である。
フェアネスを意識した検索を組み込むことで、ランキング品質と生成品質の両面を維持・強化することが少なくない。
論文 参考訳(メタデータ) (2024-09-17T23:10:04Z) - FeB4RAG: Evaluating Federated Search in the Context of Retrieval
Augmented Generation [31.371489527686578]
フェデレートされた検索システムは、複数の検索エンジンの検索結果を集約し、結果の品質を高め、ユーザの意図に合わせた適切なソースを選択する。
FEB4RAGはRAGフレームワーク内でのフェデレーション検索に特化した新しいデータセットである。
論文 参考訳(メタデータ) (2024-02-19T07:06:52Z) - Semi-Supervised Domain Generalization with Stochastic StyleMatch [90.98288822165482]
実世界のアプリケーションでは、アノテーションのコストが高いため、各ソースドメインから利用可能なラベルはわずかです。
本研究では,より現実的で実践的な半教師付き領域一般化について検討する。
提案手法であるStyleMatchは,擬似ラベルに基づく最先端の半教師付き学習手法であるFixMatchに着想を得たものである。
論文 参考訳(メタデータ) (2021-06-01T16:00:08Z) - Generation-Augmented Retrieval for Open-domain Question Answering [134.27768711201202]
GAR(Generation-Augmented Retrieval)は、オープンドメインの質問に答える機能である。
クエリーに対して多様なコンテキストを生成することは、結果の融合が常により良い検索精度をもたらすので有益であることを示す。
GARは、抽出読取装置を備えた場合、抽出QA設定の下で、自然質問およびトリビアQAデータセットの最先端性能を達成する。
論文 参考訳(メタデータ) (2020-09-17T23:08:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。