Fugu-MT 論文翻訳(概要): DoTA-RAG: Dynamic of Thought Aggregation RAG

論文の概要: DoTA-RAG: Dynamic of Thought Aggregation RAG

arxiv url: http://arxiv.org/abs/2506.12571v1
Date: Sat, 14 Jun 2025 16:56:00 GMT
ステータス: 翻訳完了
システム内更新日: 2025-06-17 17:28:46.490527
Title: DoTA-RAG: Dynamic of Thought Aggregation RAG
Title（参考訳）: DoTA-RAG:思想集約RAGのダイナミクス
Authors: Saksorn Ruangtanusak, Natthapath Rungseesiripak, Peerawat Rojratchadakorn, Monthol Charattrakool, Natapong Nitarach,
Abstract要約: DoTA-RAGは大規模Web知識インデックスに最適化された検索拡張生成システムである。 DoTA-RAGはクエリ書き換え、特別なサブインデックスへの動的ルーティング、マルチステージ検索とランキングという3段階のパイプラインで課題に対処する。
参考スコア（独自算出の注目度）: 0.0
License: http://creativecommons.org/licenses/by/4.0/
Abstract: In this paper, we introduce DoTA-RAG (Dynamic-of-Thought Aggregation RAG), a retrieval-augmented generation system optimized for high-throughput, large-scale web knowledge indexes. Traditional RAG pipelines often suffer from high latency and limited accuracy over massive, diverse datasets. DoTA-RAG addresses these challenges with a three-stage pipeline: query rewriting, dynamic routing to specialized sub-indexes, and multi-stage retrieval and ranking. We further enhance retrieval by evaluating and selecting a superior embedding model, re-embedding the large FineWeb-10BT corpus. Moreover, we create a diverse Q&A dataset of 500 questions generated via the DataMorgana setup across a broad range of WebOrganizer topics and formats. DoTA-RAG improves the answer correctness score from 0.752 (baseline, using LiveRAG pre-built vector store) to 1.478 while maintaining low latency, and it achieves a 0.929 correctness score on the Live Challenge Day. These results highlight DoTA-RAG's potential for practical deployment in domains requiring fast, reliable access to large and evolving knowledge sources.
Abstract（参考訳）: 本稿では,高スループット,大規模Web知識インデックスに最適化された検索拡張生成システムであるDoTA-RAG(Dynamic-of-Thought Aggregation RAG)を紹介する。従来のRAGパイプラインは、大規模で多様なデータセットに対して高いレイテンシと限られた正確性に悩まされることが多い。 DoTA-RAGはクエリ書き換え、特別なサブインデックスへの動的ルーティング、マルチステージ検索とランキングという3段階のパイプラインでこれらの課題に対処する。さらに,FinWeb-10BTコーパスの再埋め込みにより,優れた埋め込みモデルの評価と選択を行うことにより,検索をさらに強化する。さらに、幅広いWebOrganizerトピックとフォーマットにわたって、DataMorganaセットアップを介して生成される500の質問からなる多様なQ&Aデータセットを作成します。 DoTA-RAGは応答正当性スコアを0.752(LiveRAGプリビルドベクタストアを使用するベースライン)から1.478に改善し、Live Challenge Dayでは0.929の正当性スコアを達成している。これらの結果は、DoTA-RAGが大規模で進化する知識ソースへの高速で信頼性の高いアクセスを必要とする領域に実際に展開する可能性を示している。

関連論文リスト

DA-RAG: Dynamic Attributed Community Search for Retrieval-Augmented Generation [35.30060374506784]
この文脈における一般的な技術的アプローチは、グラフベースのRAG(G-RAG)である。本稿では,属性付きコミュニティ検索(ACS)を利用して,問合せ質問に基づいて関連部分グラフを動的に抽出するDA-RAGを提案する。複数のデータセット上でDA-RAGを評価し,従来のRAG法を最大40%上回る性能を示した。
論文参考訳（メタデータ） (2026-02-09T11:45:13Z)
DF-RAG: Query-Aware Diversity for Retrieval-Augmented Generation [4.193235647787737]
多様性に焦点をあてた検索生成(DF-RAG)について紹介する。 DF-RAGは、複雑な推論集約型QAベンチマークの性能向上のために、検索ステップに多様性を体系的に組み込む。 DF-RAGは,コサイン類似度を用いて,バニラRAGよりも4～10パーセント,推論集約QAベンチマークのF1性能を向上することを示した。
論文参考訳（メタデータ） (2026-01-23T22:47:16Z)
Leveraging Generative Models for Real-Time Query-Driven Text Summarization in Large-Scale Web Search [54.987957691350665]
クエリ駆動テキスト要約(QDTS)は、与えられたクエリに基づいてテキスト文書から簡潔で情報的な要約を生成することを目的としている。従来の抽出的要約モデルは、主にランク付け候補の要約セグメントに基づいており、産業応用において支配的なアプローチとなっている。産業Web検索におけるリアルタイムQDTSに対処するための生成モデルの適用を開拓するための新しいフレームワークを提案する。
論文参考訳（メタデータ） (2025-08-28T08:51:51Z)
Careful Queries, Credible Results: Teaching RAG Models Advanced Web Search Tools with Reinforcement Learning [48.46951981642895]
我々は、ソース制限されたクエリを生成し、信頼できないコンテンツをフィルタリングする新しいRAGフレームワークであるWebFilterを提案する。 WebFilterは応答品質と検索精度を向上し,ドメイン内ベンチマークとドメイン外ベンチマークの両方で既存のRAGメソッドよりも優れていることを示す。
論文参考訳（メタデータ） (2025-08-11T13:08:37Z)
DeepSieve: Information Sieving via LLM-as-a-Knowledge-Router [57.28685457991806]
DeepSieveはエージェントRAGフレームワークで、LLM-as-a-knowledge-routerを介して情報を収集する。我々の設計はモジュール性、透明性、適応性を重視しており、エージェントシステム設計の最近の進歩を活用している。
論文参考訳（メタデータ） (2025-07-29T17:55:23Z)
Leveraging LLM-Assisted Query Understanding for Live Retrieval-Augmented Generation [6.62734677678023]
実世界のライブ検索拡張生成(RAG)システムは、ノイズがありあいまいで、複数の意図を含むユーザクエリを処理する場合、課題に直面します。本稿では,オープンドメイン環境におけるRAGシステムの堅牢性と有効性向上を目的とした新しいフレームワークであるOmni-RAGを紹介する。
論文参考訳（メタデータ） (2025-06-26T15:35:12Z)
PreQRAG -- Classify and Rewrite for Enhanced RAG [1.652907918484303]
検索および生成品質を改善するために設計された検索拡張型アーキテクチャであるPreQRAGを紹介する。 PreQRAGには、まず各入力質問を単一ドキュメントタイプまたは複数ドキュメントタイプに分類するパイプラインが組み込まれている。単文書質問に対して,検索精度と生成関連性を改善するために質問書き直し手法を用いる。複数文書の質問に対して、より効果的に処理できる集中サブクェリに複雑なクエリを分解する。
論文参考訳（メタデータ） (2025-06-20T22:02:05Z)
Divide by Question, Conquer by Agent: SPLIT-RAG with Question-Driven Graph Partitioning [62.640169289390535]
SPLIT-RAGは、質問駆動セマンティックグラフ分割と協調サブグラフ検索による制限に対処するマルチエージェントRAGフレームワークである。革新的なフレームワークは、まずリンク情報のセマンティック分割を作成し、次にタイプ特化知識ベースを使用してマルチエージェントRAGを実現する。属性対応グラフセグメンテーションは、知識グラフを意味的に一貫性のあるサブグラフに分割し、サブグラフが異なるクエリタイプと整合することを保証する。階層的なマージモジュールは、論理的検証を通じて、部分グラフ由来の解答間の矛盾を解消する。
論文参考訳（メタデータ） (2025-05-20T06:44:34Z)
Accelerating Adaptive Retrieval Augmented Generation via Instruction-Driven Representation Reduction of Retrieval Overlaps [16.84310001807895]
本稿では,A-RAG法に適用可能なモデルに依存しないアプローチを提案する。具体的には、キャッシュアクセスと並列生成を使用して、それぞれプリフィルとデコードステージを高速化する。
論文参考訳（メタデータ） (2025-05-19T05:39:38Z)
Beyond Single Pass, Looping Through Time: KG-IRAG with Iterative Knowledge Retrieval [18.96570718233786]
GraphRAGは、外部知識を必要とするタスクにおいて、LLM(Large Language Models)の性能を高めるのに非常に効果的であることが証明されている。本稿では,KGと反復推論を統合する新しいフレームワークである知識グラフに基づく反復検索生成(KG-IRAG)を提案する。 KG-IRAGのパフォーマンスを評価するために、3つの新しいデータセットが作成され、従来のRAGアプリケーションを超える可能性を示している。
論文参考訳（メタデータ） (2025-03-18T13:11:43Z)
MES-RAG: Bringing Multi-modal, Entity-Storage, and Secure Enhancements to RAG [65.0423152595537]
本稿では,エンティティ固有のクエリ処理を強化し,正確でセキュアで一貫した応答を提供するMES-RAGを提案する。 MES-RAGは、データアクセスの前に保護を適用してシステムの整合性を確保するための積極的なセキュリティ対策を導入している。実験の結果,MES-RAGは精度とリコールの両方を著しく改善し,質問応答の安全性と有用性を向上する効果が示された。
論文参考訳（メタデータ） (2025-03-17T08:09:42Z)
TeleRAG: Efficient Retrieval-Augmented Generation Inference with Lookahead Retrieval [16.65446281180872]
Retrieval-augmented Generation (RAG)は、大規模な言語モデル(LLM)を外部データソースに拡張する。現代のRAGパイプラインは大規模なデータストアに依存しており、レイテンシに敏感なデプロイメントにおけるシステムの課題につながっている。我々は,GPUメモリの必要量を最小限に抑え,RAGレイテンシを低減する効率的な推論システムであるTeleRAGを提案する。
論文参考訳（メタデータ） (2025-02-28T11:32:22Z)
Chain-of-Retrieval Augmented Generation [72.06205327186069]
本稿では,o1-like RAGモデルを学習し,最終回答を生成する前に段階的に関連情報を抽出・推論する手法を提案する。提案手法であるCoRAGは,進化状態に基づいて動的にクエリを再構成する。
論文参考訳（メタデータ） (2025-01-24T09:12:52Z)
Benchmarking Multimodal Retrieval Augmented Generation with Dynamic VQA Dataset and Self-adaptive Planning Agent [92.5712549836791]
マルチモーダル大規模言語モデル(MLLM)に固有の「ハロシン化」問題を緩和する上で,mRAG(Multimodal Retrieval Augmented Generation)が重要な役割を果たしている。マルチモーダル検索のための自己適応型計画エージェントOmniSearchを提案する。
論文参考訳（メタデータ） (2024-11-05T09:27:21Z)
Toward General Instruction-Following Alignment for Retrieval-Augmented Generation [63.611024451010316]
Retrieval-Augmented Generation (RAG) システムの効果的な適用には、自然な指示に従うことが不可欠である。 RAGシステムにおける命令追従アライメントのための,最初の自動化,拡張性,検証可能な合成パイプラインであるVIF-RAGを提案する。
論文参考訳（メタデータ） (2024-10-12T16:30:51Z)
CRAG -- Comprehensive RAG Benchmark [58.15980697921195]
Retrieval-Augmented Generation (RAG) は、Large Language Model (LLM) の知識不足を緩和するための有望なソリューションとして最近登場した。既存のRAGデータセットは、現実世界の質問回答(QA)タスクの多様性と動的な性質を適切に表現していない。このギャップを埋めるために、包括的RAGベンチマーク(CRAG)を導入する。 CRAGは、Webと知識グラフ(KG)検索をシミュレートする4,409組の質問応答ペアとモックAPIの実際の質問応答ベンチマークである。
論文参考訳（メタデータ） (2024-06-07T08:43:07Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。