論文の概要: Optimizing Compound Retrieval Systems
- arxiv url: http://arxiv.org/abs/2504.12063v1
- Date: Wed, 16 Apr 2025 13:18:16 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-04-17 14:40:40.029742
- Title: Optimizing Compound Retrieval Systems
- Title(参考訳): 化合物検索システムの最適化
- Authors: Harrie Oosterhuis, Rolf Jagerman, Zhen Qin, Xuanhui Wang,
- Abstract要約: 本稿では,複数の予測モデルを適用したより広範な検索システムとして,複合検索システムの概念を提案する。
我々は,従来のBM25検索モデルと最先端(ペアワイズ)のLLM関連予測を組み合わせた複合手法を提案する。
実験の結果,最適化された複合検索システムは,カスケード手法よりも効率と効率のトレードオフが優れていることがわかった。
- 参考スコア(独自算出の注目度): 30.21938278062652
- License:
- Abstract: Modern retrieval systems do not rely on a single ranking model to construct their rankings. Instead, they generally take a cascading approach where a sequence of ranking models are applied in multiple re-ranking stages. Thereby, they balance the quality of the top-K ranking with computational costs by limiting the number of documents each model re-ranks. However, the cascading approach is not the only way models can interact to form a retrieval system. We propose the concept of compound retrieval systems as a broader class of retrieval systems that apply multiple prediction models. This encapsulates cascading models but also allows other types of interactions than top-K re-ranking. In particular, we enable interactions with large language models (LLMs) which can provide relative relevance comparisons. We focus on the optimization of compound retrieval system design which uniquely involves learning where to apply the component models and how to aggregate their predictions into a final ranking. This work shows how our compound approach can combine the classic BM25 retrieval model with state-of-the-art (pairwise) LLM relevance predictions, while optimizing a given ranking metric and efficiency target. Our experimental results show optimized compound retrieval systems provide better trade-offs between effectiveness and efficiency than cascading approaches, even when applied in a self-supervised manner. With the introduction of compound retrieval systems, we hope to inspire the information retrieval field to more out-of-the-box thinking on how prediction models can interact to form rankings.
- Abstract(参考訳): 現代の検索システムは、ランキングを構築するために単一のランキングモデルに依存していない。
代わりに、一般に、複数のランク付けモデルが複数の再ランクステージに適用されるカスケードアプローチを採用する。
これにより、各モデルが再ランクする文書の数を制限することにより、上位Kランキングの品質と計算コストのバランスをとることができる。
しかし、カスケーディングアプローチは、モデルが相互作用して検索システムを形成する唯一の方法ではない。
本稿では,複数の予測モデルを適用したより広範な検索システムとして,複合検索システムの概念を提案する。
これはカスケードモデルをカプセル化するが、トップKの再ランクよりも他のタイプの相互作用を可能にする。
特に,大きな言語モデル (LLM) との相互作用を可能とし,相対的関連性比較を行う。
本稿では,コンポーネントモデルの適用場所と,それらの予測を最終ランキングにまとめる方法について,一意に学習する複合検索システム設計の最適化に着目する。
本研究は,従来のBM25検索モデルとLLMの関連性予測を組み合わせながら,所定の評価基準と効率目標を最適化する方法について述べる。
提案手法は, 自己管理方式で適用しても, カスケード方式よりも効率と効率のトレードオフが良好であることを示す。
複合検索システムの導入により、予測モデルがどのように相互作用してランキングを形成するかを考える上で、情報検索分野をよりアウト・オブ・ザ・ボックスな考え方に促すことが望まれる。
関連論文リスト
- Optimizing Sequential Recommendation Models with Scaling Laws and Approximate Entropy [104.48511402784763]
SRモデルの性能法則は,モデルの性能とデータ品質の関係を理論的に調査し,モデル化することを目的としている。
データ品質を評価するために、従来のデータ量メトリクスと比較して、より曖昧なアプローチを示すために、近似エントロピー(ApEn)を提案する。
論文 参考訳(メタデータ) (2024-11-30T10:56:30Z) - A Collaborative Ensemble Framework for CTR Prediction [73.59868761656317]
我々は、複数の異なるモデルを活用するための新しいフレームワーク、CETNet(Collaborative Ensemble Training Network)を提案する。
ナイーブなモデルスケーリングとは違って,私たちのアプローチは,共同学習による多様性とコラボレーションを重視しています。
当社のフレームワークは,Metaの3つのパブリックデータセットと大規模産業データセットに基づいて検証する。
論文 参考訳(メタデータ) (2024-11-20T20:38:56Z) - Adaptive Neural Ranking Framework: Toward Maximized Business Goal for
Cascade Ranking Systems [33.46891569350896]
カスケードランキングは、オンライン広告とレコメンデーションシステムにおける大規模なトップk選択問題に広く使われている。
それまでの学習からランクへの取り組みは、モデルに完全な順序やトップクオーダを学習させることに重点を置いていた。
我々はこの手法をアダプティブ・ニューラルランキング・フレームワーク (Adaptive Neural Ranking Framework, ARF) と命名する。
論文 参考訳(メタデータ) (2023-10-16T14:43:02Z) - Retrieval-Enhanced Contrastive Vision-Text Models [61.783728119255365]
そこで本研究では,メモリから取得したクロスモーダルな情報を推論時に表現することで,その埋め込みを洗練できる視覚テキストモデルを提案する。
注目すべきことに、これは凍ったCLIPの上に軽量の単層核融合トランスを用いて行うことができる。
検索強化コントラスト訓練(RECO)がCLIPの性能を大幅に向上することを示す。
論文 参考訳(メタデータ) (2023-06-12T15:52:02Z) - Building an Efficient and Effective Retrieval-based Dialogue System via
Mutual Learning [27.04857039060308]
検索システムを構築するために,両世界の長所を組み合わせることを提案する。
従来の機能ベースの事前検索モデルを置き換えるために、高速なバイエンコーダを使用します。
我々は、相互学習を通じて、事前検索モデルと再評価モデルとを同時に訓練する。
論文 参考訳(メタデータ) (2021-10-01T01:32:33Z) - Modeling Relevance Ranking under the Pre-training and Fine-tuning
Paradigm [44.96049217770624]
本稿では,ユーザのビューとシステムビューの両方を考慮した,Pre-Rankという新しいランキングフレームワークを提案する。
ユーザの関連性のビューをモデル化するために、Pre-Rankは、大規模なユーザアクティビティデータに基づいて、初期クエリドキュメント表現を事前トレーニングする。
システムの関連性に関する見解をモデル化するために、Pre-Rankはエキスパートラベルの関連データに基づいてモデルをさらに微調整する。
論文 参考訳(メタデータ) (2021-08-12T10:37:12Z) - Efficient Data-specific Model Search for Collaborative Filtering [56.60519991956558]
協調フィルタリング(CF)はレコメンダシステムの基本的なアプローチである。
本稿では,機械学習(AutoML)の最近の進歩を動機として,データ固有のCFモデルを設計することを提案する。
ここでキーとなるのは、最先端(SOTA)のCFメソッドを統一し、それらを入力エンコーディング、埋め込み関数、インタラクション、予測関数の非結合ステージに分割する新しいフレームワークである。
論文 参考訳(メタデータ) (2021-06-14T14:30:32Z) - Towards a Better Tradeoff between Effectiveness and Efficiency in
Pre-Ranking: A Learnable Feature Selection based Approach [12.468550800027808]
現実世界の検索、レコメンデーション、広告システムでは、多段階ランキングアーキテクチャが一般的である。
本論文では,対話型アーキテクチャを備えた複雑なモデルをサポートする新しい事前ランク付け手法を提案する。
本手法は,学習可能な特徴選択手法を用いることで,有効性と効率のトレードオフを向上する。
論文 参考訳(メタデータ) (2021-05-17T09:48:15Z) - Probabilistic Case-based Reasoning for Open-World Knowledge Graph
Completion [59.549664231655726]
ケースベース推論(CBR)システムは,与えられた問題に類似した事例を検索することで,新たな問題を解決する。
本稿では,知識ベース(KB)の推論において,そのようなシステムが実現可能であることを示す。
提案手法は,KB内の類似エンティティからの推論パスを収集することにより,エンティティの属性を予測する。
論文 参考訳(メタデータ) (2020-10-07T17:48:12Z) - NASE: Learning Knowledge Graph Embedding for Link Prediction via Neural
Architecture Search [9.634626241415916]
リンク予測は、知識グラフ(KG)におけるエンティティ間の欠落した接続を予測するタスクである
これまでの研究では、Automated Machine Learning(AutoML)を使用して、データセットに最適なモデルを探していた。
リンク予測タスクのための新しいニューラルネットワーク探索(NAS)フレームワークを提案する。
論文 参考訳(メタデータ) (2020-08-18T03:34:09Z) - Document Ranking with a Pretrained Sequence-to-Sequence Model [56.44269917346376]
関連ラベルを「ターゲット語」として生成するためにシーケンス・ツー・シーケンス・モデルをどのように訓練するかを示す。
提案手法は,データポーラ方式におけるエンコーダのみのモデルよりも大幅に優れている。
論文 参考訳(メタデータ) (2020-03-14T22:29:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。