論文の概要: When Should Queries Be Decomposed? A Stage-Aware Study of Query Decomposition for Multi-Condition Retrieval
- arxiv url: http://arxiv.org/abs/2606.08577v1
- Date: Sun, 07 Jun 2026 11:13:15 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-09 14:42:06.274161
- Title: When Should Queries Be Decomposed? A Stage-Aware Study of Query Decomposition for Multi-Condition Retrieval
- Title(参考訳): クエリはいつ分解されるべきか? マルチコンディション検索のためのクエリ分解の段階的考察
- Authors: Bochao Yin, Xuan Lu, Zhengyu Qi, Xiaoyu Shen,
- Abstract要約: マルチ条件検索には、複数の制約を満たす文書を識別するシステムが必要である。
クエリ分解は直感的な治療法として広く採用されているが、検索パイプラインの段階によってその有効性は未解明のままである。
本稿では,グローバルなセマンティックコンテキストを保存するために,初期検索時にモノリシックなクエリを保持するための,ルール付きStage-Aware Decompositionフレームワークを提案する。
- 参考スコア(独自算出の注目度): 7.14438992840294
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Multi-condition retrieval requires systems to identify documents that satisfy multiple distinct constraints, moving beyond mere topical relevance. While query decomposition is widely adopted as an intuitive remedy, its effectiveness across different retrieval pipeline stages remains underexplored. In this paper, we conduct a stage-aware empirical study and uncover a stark, stage-dependent effect: decomposition during initial retrieval frequently harms retrieval performance due to semantic dilution, yet substantially improves reranking by enabling more fine-grained constraint verification. Motivated by these insights, we propose a principled Stage-Aware Decomposition framework that retains the monolithic query during initial retrieval to preserve global semantic context, while employing sub-queries exclusively during reranking for fine-grained constraint matching. Extensive evaluations on the MultiConIR and SSRB benchmarks demonstrate that our framework consistently improves ranking performance for compositional queries across multiple retrieval and reranking models. We release our code at https://github.com/EIT-NLP/Query-Decompose.
- Abstract(参考訳): 多条件検索には、複数の制約を満たす文書を識別するシステムが必要である。
クエリ分解は直感的な治療法として広く採用されているが、検索パイプラインの段階によってその効率性は未解明のままである。
本稿では,初期検索における分解は,意味的希釈による検索性能に悪影響を及ぼすが,よりきめ細かな制約検証を可能にすることにより,再評価を大幅に改善する。
これらの知見を生かして,グローバルな意味的コンテキストを維持するために,初期検索時にモノリシックなクエリを保持するための原則的なStage-Aware Decompositionフレームワークを提案する。
MultiConIR と SSRB ベンチマークの大規模評価により,本フレームワークは複数の検索および再ランクモデルにおける合成クエリのランク付け性能を一貫して向上することを示した。
コードをhttps://github.com/EIT-NLP/Query-Decomposeでリリースします。
関連論文リスト
- DocRetriever: A Plug-and-Play Framework for Multimodal Document Retrieval with Comprehensive Benchmark [48.84943754804533]
マルチモーダル文書には、テーブル、フィギュア、レイアウトなど、さまざまな要素が含まれている。
現在のアプローチでは、高精度の検索を実現するために、高密度の視覚埋め込みモデルと教師付きリランカを組み合わせるのが一般的である。
本稿では,レイアウトを意識したスパース埋め込み技術による視覚検索を支援するプラグイン・アンド・プレイフレームワークDocRetrieverを提案する。
論文 参考訳(メタデータ) (2026-05-28T14:50:53Z) - LITTA: Late-Interaction and Test-Time Alignment for Visually-Grounded Multimodal Retrieval [0.0]
LITTAは、エビデンスページ検索のためのクエリ拡張中心の検索フレームワークである。
ユーザクエリが与えられた後、LITTAは大きな言語モデルを使用して補完的なクエリ変種を生成する。
拡張されたクエリからの候補は、エビデンスカバレッジを改善するために、相互のランクフュージョンを通じて集約される。
論文 参考訳(メタデータ) (2026-03-10T13:25:39Z) - Reasoning-enhanced Query Understanding through Decomposition and Interpretation [87.56450566014625]
ReDIは、分解と解釈によるクエリ理解のための推論強化アプローチである。
我々は,大規模検索エンジンから実世界の複雑なクエリの大規模データセットをコンパイルした。
BRIGHT と BEIR の実験により、ReDI はスパースと密度の高い検索パラダイムの両方において、強いベースラインを一貫して超えることを示した。
論文 参考訳(メタデータ) (2025-09-08T10:58:42Z) - MultiConIR: Towards multi-condition Information Retrieval [38.864056667809095]
MultiConIRは、複雑なマルチ条件クエリシナリオ下での検索および再ランクモデルの評価のために設計されたベンチマークである。
ほとんどのレトリバーとリランカは、クエリの複雑さが増大するにつれて、パフォーマンスが大幅に低下する。
この研究は、リランカの性能劣化の原因を解明し、クエリ内の条件位置が類似性評価にどのように影響するかを検討する。
論文 参考訳(メタデータ) (2025-03-11T05:02:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。