論文の概要: DCD: Domain-Oriented Design for Controlled Retrieval-Augmented Generation
- arxiv url: http://arxiv.org/abs/2604.07590v1
- Date: Wed, 08 Apr 2026 20:47:51 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-10 18:34:05.557086
- Title: DCD: Domain-Oriented Design for Controlled Retrieval-Augmented Generation
- Title(参考訳): DCD:制御された検索拡張生成のためのドメイン指向設計
- Authors: Valeriy Kovalskiy, Nikita Belov, Nikita Miteyko, Igor Reshetnikov, Max Maximov,
- Abstract要約: DCD(Domain-Collection-Document)は,RAGシステムにおいて,基礎となる言語モデルを変更することなくクエリ処理を構造化・制御するためのドメイン指向設計である。
提案手法は,構造化モデル出力に基づく情報空間の階層的分解と多段階ルーティングに依存する。
本稿では、DCDアーキテクチャとワークフローを説明し、合成評価データセットにおける結果について議論し、適用されたRAGシナリオにおけるロバスト性、事実精度、回答関連性への影響を強調した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Retrieval-Augmented Generation (RAG) is widely used to ground large language models in external knowledge sources. However, when applied to heterogeneous corpora and multi-step queries, Naive RAG pipelines often degrade in quality due to flat knowledge representations and the absence of explicit workflows. In this work, we introduce DCD (Domain-Collection-Document), a domain-oriented design to structure knowledge and control query processing in RAG systems without modifying the underlying language model. The proposed approach relies on a hierarchical decomposition of the information space and multi-stage routing based on structured model outputs, enabling progressive restriction of both retrieval and generation scopes. The architecture is complemented by smart chunking, hybrid retrieval, and integrated validation and generation guardrail mechanisms. We describe the DCD architecture and workflow and discuss evaluation results on synthetic evaluation dataset, highlighting their impact on robustness, factual accuracy, and answer relevance in applied RAG scenarios.
- Abstract(参考訳): Retrieval-Augmented Generation (RAG) は、大規模な言語モデルを外部の知識ソースに基盤として広く使われている。
しかし、異種コーパスやマルチステップクエリに適用すると、Naive RAGパイプラインはフラットな知識表現と明示的なワークフローがないため、品質が劣化することが多い。
本研究では,DAGシステムにおいて,基礎となる言語モデルを変更することなく知識を構造化し,クエリ処理を制御するドメイン指向設計であるDCD(Domain-Collection-Document)を紹介する。
提案手法は、情報空間の階層的分解と構造化モデル出力に基づく多段階ルーティングに依存し、検索と生成の両方のプログレッシブな制限を可能にする。
アーキテクチャは、スマートチャンキング、ハイブリッド検索、統合検証と生成ガードレール機構によって補完される。
DCDのアーキテクチャとワークフローを解説し、合成評価データセットの評価結果について議論し、適用されたRAGシナリオにおけるロバスト性、事実精度、回答関連性への影響を強調した。
関連論文リスト
- Is Agentic RAG worth it? An experimental comparison of RAG approaches [0.07777489763207261]
検索・拡張生成システムは通常、ジェネレータと検索コンポーネントの組み合わせで定義される。
これらの欠点は「強化されたRAG」の開発を動機づけている。
大規模言語モデルの自己回帰能力の増大により,新たなパラダイムが実現した。
論文 参考訳(メタデータ) (2026-01-12T16:43:44Z) - Higress-RAG: A Holistic Optimization Framework for Enterprise Retrieval-Augmented Generation via Dual Hybrid Retrieval, Adaptive Routing, and CRAG [0.0]
Higress RAG MCP Serverは、AIデプロイメントのための、新しいエンタープライズ中心のアーキテクチャである。
システムは適応ルーティング、セマンティックキャッシュ、ハイブリッド検索、修正RAGを編成する。
Systemは、エンタープライズAIデプロイメントのためのスケーラブルで幻覚に強いソリューションを提供する。
論文 参考訳(メタデータ) (2025-12-30T05:28:05Z) - Retrieval Augmented Generation (RAG) for Fintech: Agentic Design and Evaluation [0.16754194618631593]
本稿では,ドメイン固有かつ密度の高い用語問題に対処するエージェントRAGアーキテクチャを提案する。
企業知識ベースから85の質問-回答-参照の3分の1をキュレートしたデータセットを用いて,標準的なRAGベースラインに対するアプローチを評価した。
論文 参考訳(メタデータ) (2025-10-29T13:41:36Z) - Domain-Specific Data Generation Framework for RAG Adaptation [58.20906914537952]
Retrieval-Augmented Generation (RAG)は、大規模言語モデルの言語理解と推論能力と外部検索を組み合わせ、ドメイン基底応答を可能にする。
本稿では,様々なRAG適応手法に合わせて,ドメイン基底型質問応答コンテキスト(QAC)トリプルを生成するフレームワークであるRAGenを提案する。
論文 参考訳(メタデータ) (2025-10-13T09:59:49Z) - Retrieval-augmented reasoning with lean language models [5.615564811138556]
複雑なドメイン固有のクエリを解釈できる検索拡張会話エージェントを開発した。
本システムでは,細調整されたQwen2.5-Instructモデルと高密度レトリバーを統合した。
すべての実装の詳細とコードは、ドメイン間のサポートと適応のために公開されています。
論文 参考訳(メタデータ) (2025-08-15T10:38:15Z) - DeepSieve: Information Sieving via LLM-as-a-Knowledge-Router [57.28685457991806]
DeepSieveはエージェントRAGフレームワークで、LLM-as-a-knowledge-routerを介して情報を収集する。
我々の設計はモジュール性、透明性、適応性を重視しており、エージェントシステム設計の最近の進歩を活用している。
論文 参考訳(メタデータ) (2025-07-29T17:55:23Z) - Attributing Response to Context: A Jensen-Shannon Divergence Driven Mechanistic Study of Context Attribution in Retrieval-Augmented Generation [52.3707788779464]
我々は、コンテキストに対する属性応答(ARC-JSD)のための新しいJensen-Shannon Divergence駆動方式を提案する。
ARC-JSDは、追加の微調整、勾配計算、サロゲートモデリングなしで、重要な文脈文の効率的かつ正確な識別を可能にする。
TyDi QA, Hotpot QA, Musique など,様々なスケールの命令調整 LLM を用いたRAG ベンチマークの評価により,精度が向上し,計算効率が向上した。
論文 参考訳(メタデータ) (2025-05-22T09:04:03Z) - HM-RAG: Hierarchical Multi-Agent Multimodal Retrieval Augmented Generation [11.53083922927901]
HM-RAGは階層型マルチエージェントマルチモーダルRAGフレームワークである。
構造化、非構造化、グラフベースのデータ間での動的知識合成のための協調知能の先駆者である。
論文 参考訳(メタデータ) (2025-04-13T06:55:33Z) - RAGEval: Scenario Specific RAG Evaluation Dataset Generation Framework [66.93260816493553]
本稿では,様々なシナリオにまたがってRAGシステムを評価するためのフレームワークであるRAGvalを紹介する。
事実の正確性に焦点をあてて,完全性,幻覚,不適切性の3つの新しい指標を提案する。
実験結果から, RAGEvalは, 生成した試料の明瞭度, 安全性, 適合性, 豊かさにおいて, ゼロショット法とワンショット法より優れていた。
論文 参考訳(メタデータ) (2024-08-02T13:35:11Z) - CRUD-RAG: A Comprehensive Chinese Benchmark for Retrieval-Augmented Generation of Large Language Models [49.16989035566899]
Retrieval-Augmented Generation (RAG)は、大規模言語モデル(LLM)の能力を高める技術である。
本稿では,大規模かつ包括的なベンチマークを構築し,様々なRAGアプリケーションシナリオにおけるRAGシステムのすべてのコンポーネントを評価する。
論文 参考訳(メタデータ) (2024-01-30T14:25:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。