論文の概要: DoTA-RAG: Dynamic of Thought Aggregation RAG
- arxiv url: http://arxiv.org/abs/2506.12571v1
- Date: Sat, 14 Jun 2025 16:56:00 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-17 17:28:46.490527
- Title: DoTA-RAG: Dynamic of Thought Aggregation RAG
- Title(参考訳): DoTA-RAG:思想集約RAGのダイナミクス
- Authors: Saksorn Ruangtanusak, Natthapath Rungseesiripak, Peerawat Rojratchadakorn, Monthol Charattrakool, Natapong Nitarach,
- Abstract要約: DoTA-RAGは大規模Web知識インデックスに最適化された検索拡張生成システムである。
DoTA-RAGはクエリ書き換え、特別なサブインデックスへの動的ルーティング、マルチステージ検索とランキングという3段階のパイプラインで課題に対処する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In this paper, we introduce DoTA-RAG (Dynamic-of-Thought Aggregation RAG), a retrieval-augmented generation system optimized for high-throughput, large-scale web knowledge indexes. Traditional RAG pipelines often suffer from high latency and limited accuracy over massive, diverse datasets. DoTA-RAG addresses these challenges with a three-stage pipeline: query rewriting, dynamic routing to specialized sub-indexes, and multi-stage retrieval and ranking. We further enhance retrieval by evaluating and selecting a superior embedding model, re-embedding the large FineWeb-10BT corpus. Moreover, we create a diverse Q&A dataset of 500 questions generated via the DataMorgana setup across a broad range of WebOrganizer topics and formats. DoTA-RAG improves the answer correctness score from 0.752 (baseline, using LiveRAG pre-built vector store) to 1.478 while maintaining low latency, and it achieves a 0.929 correctness score on the Live Challenge Day. These results highlight DoTA-RAG's potential for practical deployment in domains requiring fast, reliable access to large and evolving knowledge sources.
- Abstract(参考訳): 本稿では,高スループット,大規模Web知識インデックスに最適化された検索拡張生成システムであるDoTA-RAG(Dynamic-of-Thought Aggregation RAG)を紹介する。
従来のRAGパイプラインは、大規模で多様なデータセットに対して高いレイテンシと限られた正確性に悩まされることが多い。
DoTA-RAGはクエリ書き換え、特別なサブインデックスへの動的ルーティング、マルチステージ検索とランキングという3段階のパイプラインでこれらの課題に対処する。
さらに,FinWeb-10BTコーパスの再埋め込みにより,優れた埋め込みモデルの評価と選択を行うことにより,検索をさらに強化する。
さらに、幅広いWebOrganizerトピックとフォーマットにわたって、DataMorganaセットアップを介して生成される500の質問からなる多様なQ&Aデータセットを作成します。
DoTA-RAGは応答正当性スコアを0.752(LiveRAGプリビルドベクタストアを使用するベースライン)から1.478に改善し、Live Challenge Dayでは0.929の正当性スコアを達成している。
これらの結果は、DoTA-RAGが大規模で進化する知識ソースへの高速で信頼性の高いアクセスを必要とする領域に実際に展開する可能性を示している。
関連論文リスト
- DeepSieve: Information Sieving via LLM-as-a-Knowledge-Router [57.28685457991806]
DeepSieveはエージェントRAGフレームワークで、LLM-as-a-knowledge-routerを介して情報を収集する。
我々の設計はモジュール性、透明性、適応性を重視しており、エージェントシステム設計の最近の進歩を活用している。
論文 参考訳(メタデータ) (2025-07-29T17:55:23Z) - Leveraging LLM-Assisted Query Understanding for Live Retrieval-Augmented Generation [6.62734677678023]
実世界のライブ検索拡張生成(RAG)システムは、ノイズがありあいまいで、複数の意図を含むユーザクエリを処理する場合、課題に直面します。
本稿では,オープンドメイン環境におけるRAGシステムの堅牢性と有効性向上を目的とした新しいフレームワークであるOmni-RAGを紹介する。
論文 参考訳(メタデータ) (2025-06-26T15:35:12Z) - PreQRAG -- Classify and Rewrite for Enhanced RAG [1.652907918484303]
検索および生成品質を改善するために設計された検索拡張型アーキテクチャであるPreQRAGを紹介する。
PreQRAGには、まず各入力質問を単一ドキュメントタイプまたは複数ドキュメントタイプに分類するパイプラインが組み込まれている。
単文書質問に対して,検索精度と生成関連性を改善するために質問書き直し手法を用いる。
複数文書の質問に対して、より効果的に処理できる集中サブクェリに複雑なクエリを分解する。
論文 参考訳(メタデータ) (2025-06-20T22:02:05Z) - Accelerating Adaptive Retrieval Augmented Generation via Instruction-Driven Representation Reduction of Retrieval Overlaps [16.84310001807895]
本稿では,A-RAG法に適用可能なモデルに依存しないアプローチを提案する。
具体的には、キャッシュアクセスと並列生成を使用して、それぞれプリフィルとデコードステージを高速化する。
論文 参考訳(メタデータ) (2025-05-19T05:39:38Z) - Beyond Single Pass, Looping Through Time: KG-IRAG with Iterative Knowledge Retrieval [18.96570718233786]
GraphRAGは、外部知識を必要とするタスクにおいて、LLM(Large Language Models)の性能を高めるのに非常に効果的であることが証明されている。
本稿では,KGと反復推論を統合する新しいフレームワークである知識グラフに基づく反復検索生成(KG-IRAG)を提案する。
KG-IRAGのパフォーマンスを評価するために、3つの新しいデータセットが作成され、従来のRAGアプリケーションを超える可能性を示している。
論文 参考訳(メタデータ) (2025-03-18T13:11:43Z) - MES-RAG: Bringing Multi-modal, Entity-Storage, and Secure Enhancements to RAG [65.0423152595537]
本稿では,エンティティ固有のクエリ処理を強化し,正確でセキュアで一貫した応答を提供するMES-RAGを提案する。
MES-RAGは、データアクセスの前に保護を適用してシステムの整合性を確保するための積極的なセキュリティ対策を導入している。
実験の結果,MES-RAGは精度とリコールの両方を著しく改善し,質問応答の安全性と有用性を向上する効果が示された。
論文 参考訳(メタデータ) (2025-03-17T08:09:42Z) - Chain-of-Retrieval Augmented Generation [72.06205327186069]
本稿では,o1-like RAGモデルを学習し,最終回答を生成する前に段階的に関連情報を抽出・推論する手法を提案する。
提案手法であるCoRAGは,進化状態に基づいて動的にクエリを再構成する。
論文 参考訳(メタデータ) (2025-01-24T09:12:52Z) - Benchmarking Multimodal Retrieval Augmented Generation with Dynamic VQA Dataset and Self-adaptive Planning Agent [92.5712549836791]
マルチモーダル大規模言語モデル(MLLM)に固有の「ハロシン化」問題を緩和する上で,mRAG(Multimodal Retrieval Augmented Generation)が重要な役割を果たしている。
マルチモーダル検索のための自己適応型計画エージェントOmniSearchを提案する。
論文 参考訳(メタデータ) (2024-11-05T09:27:21Z) - Toward General Instruction-Following Alignment for Retrieval-Augmented Generation [63.611024451010316]
Retrieval-Augmented Generation (RAG) システムの効果的な適用には、自然な指示に従うことが不可欠である。
RAGシステムにおける命令追従アライメントのための,最初の自動化,拡張性,検証可能な合成パイプラインであるVIF-RAGを提案する。
論文 参考訳(メタデータ) (2024-10-12T16:30:51Z) - CRAG -- Comprehensive RAG Benchmark [58.15980697921195]
Retrieval-Augmented Generation (RAG) は、Large Language Model (LLM) の知識不足を緩和するための有望なソリューションとして最近登場した。
既存のRAGデータセットは、現実世界の質問回答(QA)タスクの多様性と動的な性質を適切に表現していない。
このギャップを埋めるために、包括的RAGベンチマーク(CRAG)を導入する。
CRAGは、Webと知識グラフ(KG)検索をシミュレートする4,409組の質問応答ペアとモックAPIの実際の質問応答ベンチマークである。
論文 参考訳(メタデータ) (2024-06-07T08:43:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。