論文の概要: DoTA-RAG: Dynamic of Thought Aggregation RAG
- arxiv url: http://arxiv.org/abs/2506.12571v1
- Date: Sat, 14 Jun 2025 16:56:00 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-17 17:28:46.490527
- Title: DoTA-RAG: Dynamic of Thought Aggregation RAG
- Title(参考訳): DoTA-RAG:思想集約RAGのダイナミクス
- Authors: Saksorn Ruangtanusak, Natthapath Rungseesiripak, Peerawat Rojratchadakorn, Monthol Charattrakool, Natapong Nitarach,
- Abstract要約: DoTA-RAGは大規模Web知識インデックスに最適化された検索拡張生成システムである。
DoTA-RAGはクエリ書き換え、特別なサブインデックスへの動的ルーティング、マルチステージ検索とランキングという3段階のパイプラインで課題に対処する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In this paper, we introduce DoTA-RAG (Dynamic-of-Thought Aggregation RAG), a retrieval-augmented generation system optimized for high-throughput, large-scale web knowledge indexes. Traditional RAG pipelines often suffer from high latency and limited accuracy over massive, diverse datasets. DoTA-RAG addresses these challenges with a three-stage pipeline: query rewriting, dynamic routing to specialized sub-indexes, and multi-stage retrieval and ranking. We further enhance retrieval by evaluating and selecting a superior embedding model, re-embedding the large FineWeb-10BT corpus. Moreover, we create a diverse Q&A dataset of 500 questions generated via the DataMorgana setup across a broad range of WebOrganizer topics and formats. DoTA-RAG improves the answer correctness score from 0.752 (baseline, using LiveRAG pre-built vector store) to 1.478 while maintaining low latency, and it achieves a 0.929 correctness score on the Live Challenge Day. These results highlight DoTA-RAG's potential for practical deployment in domains requiring fast, reliable access to large and evolving knowledge sources.
- Abstract(参考訳): 本稿では,高スループット,大規模Web知識インデックスに最適化された検索拡張生成システムであるDoTA-RAG(Dynamic-of-Thought Aggregation RAG)を紹介する。
従来のRAGパイプラインは、大規模で多様なデータセットに対して高いレイテンシと限られた正確性に悩まされることが多い。
DoTA-RAGはクエリ書き換え、特別なサブインデックスへの動的ルーティング、マルチステージ検索とランキングという3段階のパイプラインでこれらの課題に対処する。
さらに,FinWeb-10BTコーパスの再埋め込みにより,優れた埋め込みモデルの評価と選択を行うことにより,検索をさらに強化する。
さらに、幅広いWebOrganizerトピックとフォーマットにわたって、DataMorganaセットアップを介して生成される500の質問からなる多様なQ&Aデータセットを作成します。
DoTA-RAGは応答正当性スコアを0.752(LiveRAGプリビルドベクタストアを使用するベースライン)から1.478に改善し、Live Challenge Dayでは0.929の正当性スコアを達成している。
これらの結果は、DoTA-RAGが大規模で進化する知識ソースへの高速で信頼性の高いアクセスを必要とする領域に実際に展開する可能性を示している。
関連論文リスト
- Accelerating Adaptive Retrieval Augmented Generation via Instruction-Driven Representation Reduction of Retrieval Overlaps [16.84310001807895]
本稿では,A-RAG法に適用可能なモデルに依存しないアプローチを提案する。
具体的には、キャッシュアクセスと並列生成を使用して、それぞれプリフィルとデコードステージを高速化する。
論文 参考訳(メタデータ) (2025-05-19T05:39:38Z) - Beyond Single Pass, Looping Through Time: KG-IRAG with Iterative Knowledge Retrieval [18.96570718233786]
GraphRAGは、外部知識を必要とするタスクにおいて、LLM(Large Language Models)の性能を高めるのに非常に効果的であることが証明されている。
本稿では,KGと反復推論を統合する新しいフレームワークである知識グラフに基づく反復検索生成(KG-IRAG)を提案する。
KG-IRAGのパフォーマンスを評価するために、3つの新しいデータセットが作成され、従来のRAGアプリケーションを超える可能性を示している。
論文 参考訳(メタデータ) (2025-03-18T13:11:43Z) - Chain-of-Retrieval Augmented Generation [72.06205327186069]
本稿では,o1-like RAGモデルを学習し,最終回答を生成する前に段階的に関連情報を抽出・推論する手法を提案する。
提案手法であるCoRAGは,進化状態に基づいて動的にクエリを再構成する。
論文 参考訳(メタデータ) (2025-01-24T09:12:52Z) - Benchmarking Multimodal Retrieval Augmented Generation with Dynamic VQA Dataset and Self-adaptive Planning Agent [92.5712549836791]
マルチモーダル大規模言語モデル(MLLM)に固有の「ハロシン化」問題を緩和する上で,mRAG(Multimodal Retrieval Augmented Generation)が重要な役割を果たしている。
マルチモーダル検索のための自己適応型計画エージェントOmniSearchを提案する。
論文 参考訳(メタデータ) (2024-11-05T09:27:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。