論文の概要: MODE: Mixture of Document Experts for RAG
- arxiv url: http://arxiv.org/abs/2509.00100v1
- Date: Wed, 27 Aug 2025 17:45:16 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-04 15:17:03.079651
- Title: MODE: Mixture of Document Experts for RAG
- Title(参考訳): MODE:RAGのためのドキュメントエキスパートの混成
- Authors: Rahul Anand,
- Abstract要約: MODEは、よりきめ細かい近接探索をクラスタ・アンド・ルート検索に置き換える。
ドキュメントは埋め込み、セマンティック・コヒーレントなクラスタにグループ化され、キャッシュされたセントロイドで表現される。
100-500チャンクのHotpotQAとSQuADコーパスでは、MODEは解答品質において密度の高い検索基準線を超える。
- 参考スコア(独自算出の注目度): 0.532836690371986
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Retrieval-Augmented Generation (RAG) often relies on large vector databases and cross-encoders tuned for large-scale corpora, which can be excessive for small, domain-specific collections. We present MODE (Mixture of Document Experts), a lightweight alternative that replaces fine-grained nearest-neighbor search with cluster-and-route retrieval. Documents are embedded, grouped into semantically coherent clusters, and represented by cached centroids. At query time, we route to the top centroid(s) and retrieve context only within those clusters, eliminating external vector-database infrastructure and reranking while keeping latency low. On HotpotQA and SQuAD corpora with 100-500 chunks, MODE matches or exceeds a dense-retrieval baseline in answer quality while reducing end-to-end retrieval time. Ablations show that cluster granularity and multi-cluster routing control the recall/precision trade-off, and that tighter clusters improve downstream accuracy. MODE offers a practical recipe for small and medium corpora where simplicity, speed, and topical focus matter.
- Abstract(参考訳): Retrieval-Augmented Generation (RAG) は、大規模コーパス用に調整された大規模なベクトルデータベースやクロスエンコーダに依存することが多い。
MODE(Mixture of Document Experts:文書専門家のミクチャー)は、よりきめ細かな近接探索をクラスタ・アンド・ルート検索に置き換える軽量な代替手段である。
ドキュメントは埋め込み、セマンティック・コヒーレントなクラスタにグループ化され、キャッシュされたセントロイドで表現される。
クエリ時に、トップセントロイドにルートして、これらのクラスタ内でのみコンテキストを検索し、外部のベクトルデータベースインフラストラクチャを排除し、レイテンシを低く保ちながら再ランク付けします。
100-500チャンクのHotpotQAとSQuADコーパスでは、MODEは、エンドツーエンドの検索時間を短縮しつつ、回答品質の高密度検索ベースラインにマッチまたは超過する。
アブレーションは、クラスタの粒度とマルチクラスタルーティングがリコール/精度のトレードオフを制御し、クラスタがより厳格なクラスタによって下流の精度が向上することを示している。
MODEは、シンプルさ、スピード、トピックが重要となる中小コーパスの実践的なレシピを提供する。
関連論文リスト
- Information-Theoretic Generative Clustering of Documents [24.56214029342293]
文書の集合をクラスタリングするための生成クラスタリング(GC)を$mathrmX$で提示する。
大規模言語モデル(LLM)は確率分布を提供するため、2つの文書間の類似性を厳密に定義することができる。
我々はGCが最先端のパフォーマンスを達成し、従来のクラスタリング手法よりも大きなマージンで優れていることを示す。
論文 参考訳(メタデータ) (2024-12-18T06:21:21Z) - Generative Dense Retrieval: Memory Can Be a Burden [16.964086245755798]
Generative Retrieval (GR) はクエリが与えられたドキュメント識別子を自動でデコードする。
Dense Retrieval (DR) はクラスタから関連ドキュメントへのきめ細かいクラスタ内マッチングを実現するために導入された。
DRは、NQデータセットを複数の設定で平均3.0R@100改善する。
論文 参考訳(メタデータ) (2024-01-19T04:24:07Z) - Hard Regularization to Prevent Deep Online Clustering Collapse without
Data Augmentation [65.268245109828]
オンラインディープクラスタリング(オンラインディープクラスタリング)とは、機能抽出ネットワークとクラスタリングモデルを組み合わせて、クラスタラベルを処理された各新しいデータポイントまたはバッチに割り当てることである。
オフラインメソッドよりも高速で汎用性が高いが、オンラインクラスタリングは、エンコーダがすべての入力を同じポイントにマッピングし、すべてを単一のクラスタに配置する、崩壊したソリューションに容易に到達することができる。
本稿では,データ拡張を必要としない手法を提案する。
論文 参考訳(メタデータ) (2023-03-29T08:23:26Z) - Hybrid Inverted Index Is a Robust Accelerator for Dense Retrieval [25.402767809863946]
逆ファイル構造は高密度検索を高速化する一般的な手法である。
本研究では,Hybrid Inverted Index (HI$2$)を提案する。
論文 参考訳(メタデータ) (2022-10-11T15:12:41Z) - Genie: A new, fast, and outlier-resistant hierarchical clustering
algorithm [3.7491936479803054]
我々はGenieと呼ばれる新しい階層的クラスタリングリンク基準を提案する。
我々のアルゴリズムは、2つのクラスタを、選択された経済不平等尺度が与えられたしきい値を超えないようにリンクする。
このアルゴリズムのリファレンス実装は、Rのためのオープンソースの'genie'パッケージに含まれている。
論文 参考訳(メタデータ) (2022-09-13T06:42:53Z) - Meta Clustering Learning for Large-scale Unsupervised Person
Re-identification [124.54749810371986]
メタクラスタリング学習(MCL)と呼ばれる「大規模タスクのための小さなデータ」パラダイムを提案する。
MCLは、第1フェーズのトレーニングのためにコンピューティングを節約するためにクラスタリングを介して、未ラベルデータのサブセットを擬似ラベル付けするのみである。
提案手法は計算コストを大幅に削減すると同時に,従来よりも優れた性能を実現している。
論文 参考訳(メタデータ) (2021-11-19T04:10:18Z) - Correlation Clustering Reconstruction in Semi-Adversarial Models [70.11015369368272]
相関クラスタリングは多くのアプリケーションにおいて重要なクラスタリング問題である。
本研究では,ランダムノイズや対向的な修正によって崩壊した潜伏クラスタリングを再構築しようとする,この問題の再構築版について検討する。
論文 参考訳(メタデータ) (2021-08-10T14:46:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。