論文の概要: ICICLE: Expanding Retrieval with In-Context Documents
- arxiv url: http://arxiv.org/abs/2605.26902v2
- Date: Wed, 27 May 2026 02:21:28 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-28 17:38:55.158016
- Title: ICICLE: Expanding Retrieval with In-Context Documents
- Title(参考訳): ICICLE: コンテキスト内ドキュメントによる検索の拡張
- Authors: Yu-Chen Den, Yung-Yu Shih, Zhi Rui Tam, Kuan-Yu Chen, Pu-Jen Cheng, Yun-Nung Chen, Eugene Yang,
- Abstract要約: 生成検索(GR)は、パラメトリック知識を用いてクエリを直接ドキュメント識別子(ドクト)にマッピングする。
我々は、パラメトリックメモリとコンテキストが提供する文書とドキュメントのペアの両方に対して、ソース・アウェア・ドシド生成を行う、コンテキスト内インデクシングフレームワークICICLEを提案する。
- 参考スコア(独自算出の注目度): 28.99813139934325
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Generative retrieval (GR) maps queries directly to document identifiers (docids) using parametric knowledge, However, this design makes corpus expansion costly: adding new documents requires updating model parameters to encode new document-docid associations incurs repeated training and catastrophic forgetting of previously indexed documents. In this work, we revisit incremental GR as an in-context retrieval problem, where newly added documents are supplied as inference-time document-docid evidence. We propose ICICLE, an in-context indexing framework that performs source-aware docid generation over both parametric memory and context-provided document-docid pairs. ICICLE combines a `[COPY]`-based routing mechanism, preference-based calibration, and large context adaptation to distinguish context-grounded retrieval from parametric retrieval. Experiments on MS MARCO and NQ320K show that ICICLE improves retrieval of newly introduced documents while preserving seen-document retention without corpus-specific retraining. Our analysis further shows that high-shot degradation is mainly caused by routing failure, highlighting source-selection calibration as a key bottleneck for scaling in-context generative retrieval.
- Abstract(参考訳): 生成的検索(GR)は、クエリをパラメトリック知識を用いて文書識別子(ドキュメント)に直接マッピングするが、この設計では、コーパスの拡張をコストがかかる。
本研究では、インコンテキスト検索問題としてインクリメンタルGRを再考し、新たに追加された文書を推論時文書決定証拠として供給する。
我々は、パラメトリックメモリとコンテキストが提供する文書とドキュメントのペアの両方に対して、ソース・アウェア・ドシド生成を行う、コンテキスト内インデクシングフレームワークICICLEを提案する。
ICICLE は `[COPY]` ベースのルーティング機構、嗜好ベースのキャリブレーション、コンテキストグラウンド検索とパラメトリック検索を区別するための大きなコンテキスト適応を組み合わせたものである。
MS MARCO と NQ320K の実験では、ICICLE は、コーパス固有のリトレーニングなしで文書の保存を保ちながら、新しく導入された文書の検索を改善する。
さらに,高画質化は主として経路障害に起因することを示し,ソース選択校正をテキスト内生成検索のスケーリングの鍵となるボトルネックとして強調した。
関連論文リスト
- CHOP: Chunkwise Context-Preserving Framework for RAG on Multi Documents [6.134883925217888]
大規模言語モデル(LLM)によるチャンク関係を反復的に評価するフレームワークであるCHOPを提案する。
CHOPはCNM-ExtractorとContinuity Decision Moduleという2つの重要なコンポーネントを統合している。
ベンチマークデータセットの実験では、CHOPは検索の混乱を緩和し、高品質な知識ベースを構築するためのスケーラブルなアプローチを提供する。
論文 参考訳(メタデータ) (2026-04-17T08:05:17Z) - Model Editing for New Document Integration in Generative Information Retrieval [110.90609826290968]
生成検索(GR)は文書識別子(docID)の生成として情報検索(IR)タスクを再構成する
既存のGRモデルは、新たに追加されたドキュメントへの一般化が不十分で、しばしば正しいドキュメントIDを生成できない。
DOMEは,GRモデルを非表示文書に効果的かつ効率的に適応する新しい手法である。
論文 参考訳(メタデータ) (2026-03-03T09:13:38Z) - Cognitive-Aligned Document Selection for Retrieval-augmented Generation [2.9060210098040855]
本稿では,クエリを動的に更新し,高品質で信頼性の高い検索文書をフィルタリングするGGatrievalを提案する。
ユーザクエリを構文コンポーネントにパースし、検索したドキュメントときめ細かいグラウンドアライメントを実行する。
提案手法では,検索した文書をフィルタリングするための新しい基準を導入し,ターゲット情報を取得するための人的戦略を密にエミュレートする。
論文 参考訳(メタデータ) (2025-02-17T13:00:15Z) - Continual Learning for Generative Retrieval over Dynamic Corpora [115.79012933205756]
生成検索(GR)はパラメトリックモデルに基づいて関連文書の識別子(ドシデクス)を直接予測する。
クエリに応答する能力を保ちながら、新しいドキュメントをインクリメンタルにインデックスする能力は、GRモデルを適用する上で不可欠である。
我々は,CLEVERモデルのための新しい連続学習モデルを提案し,GRのための連続学習に2つの大きな貢献をした。
論文 参考訳(メタデータ) (2023-08-29T01:46:06Z) - DSI++: Updating Transformer Memory with New Documents [95.70264288158766]
DSI++は、DSIが新たなドキュメントをインクリメンタルにインデクシングするための継続的な学習課題である。
新たな文書の連続的な索引付けは,それまでの索引付け文書をかなり忘れてしまうことを示す。
文書の擬似クエリをサンプルとして生成メモリを導入し、連続的なインデックス付け中に補足することで、検索タスクの忘れを防止する。
論文 参考訳(メタデータ) (2022-12-19T18:59:34Z) - GERE: Generative Evidence Retrieval for Fact Verification [57.78768817972026]
本稿では,ジェネレーション方式で証拠を検索する最初のシステムであるGEREを提案する。
FEVERデータセットの実験結果は、GEREが最先端のベースラインよりも大幅に改善されていることを示している。
論文 参考訳(メタデータ) (2022-04-12T03:49:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。