論文の概要: Association Is Not Similarity: Learning Corpus-Specific Associations for Multi-Hop Retrieval
- arxiv url: http://arxiv.org/abs/2604.20850v1
- Date: Fri, 13 Feb 2026 21:02:53 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-04 02:32:14.106639
- Title: Association Is Not Similarity: Learning Corpus-Specific Associations for Multi-Hop Retrieval
- Title(参考訳): Association is not similarity: Learning Corpus-Specific Associations for Multi-Hop Retrieval
- Authors: Jason Dury,
- Abstract要約: Association-Augmented Retrievalは埋め込み空間における通路間の連想関係を学習する。
HotpotQAでは、AARは評価セットチューニングなしでRecall@5を0.831から0.916(+8.6ポイント)に改善した。
MuSiQueでは、AARはトランスダクティブ設定で+10.1点を達成する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Dense retrieval systems rank passages by embedding similarity to a query, but multi-hop questions require passages that are associatively related through shared reasoning chains. We introduce Association-Augmented Retrieval (AAR), a lightweight transductive reranking method that trains a small MLP (4.2M parameters) to learn associative relationships between passages in embedding space using contrastive learning on co-occurrence annotations. At inference time, AAR reranks an initial dense retrieval candidate set using bi-directional association scoring. On HotpotQA, AAR improves passage Recall@5 from 0.831 to 0.916 (+8.6 points) without evaluation-set tuning, with gains concentrated on hard questions where the dense baseline fails (+28.5 points). On MuSiQue, AAR achieves +10.1 points in the transductive setting. An inductive model trained on training-split associations and evaluated on unseen validation associations shows no significant improvement, suggesting that the method captures corpus-specific co-occurrences rather than transferable patterns. Ablation studies support this interpretation: training on semantically similar but non-associated passage pairs degrades retrieval below the baseline, while shuffling association pairs causes severe degradation. A downstream QA evaluation shows retrieval gains translate to +6.4 exact match improvement. The method adds 3.7ms per query, trains in under two minutes on a single GPU, and requires no LLM-based indexing.
- Abstract(参考訳): デンス検索システムは、クエリと類似性を埋め込むことで、パスをランク付けするが、マルチホップ質問では、共有推論チェーンを通じて連想的に関連付けられたパスを必要とする。
本稿では,AAR(Association-Augmented Retrieval)について紹介する。AAR(Association-Augmented Retrieval)は,小さなMLP(4.2Mパラメータ)をトレーニングして,共起アノテーションのコントラスト学習を用いて,埋め込み空間内の通路間の連想関係を学習する軽量トランスダクティブリグレード手法である。
推測時、AARは、双方向のアソシエーションスコアリングを用いて、初期密集した検索候補セットをリランクする。
HotpotQAでは、AARは評価セットチューニングなしでRecall@5を0.831から0.916(+8.6ポイント)に改善し、高密度のベースラインが失敗する難問(+28.5ポイント)に集中する。
MuSiQueでは、AARはトランスダクティブ設定で+10.1点を達成する。
本手法は, 伝達可能なパターンではなく, コーパス固有の共起物を捕集するものであることを示唆する。
意味論的に類似しているが非関連パスペアのトレーニングはベースラインの下の検索を劣化させ、シャッフルするアソシエーションペアは深刻な劣化を引き起こす。
下流QA評価は、検索ゲインが+6.4の正確なマッチング改善に変換されることを示している。
クエリ毎に3.7msを追加し、単一のGPUで2分以下でトレーニングする。
関連論文リスト
- iCoRe: An Iterative Correlation-Aware Retriever for Bug Reproduction Test Generation [10.824024745675281]
iCoReは反復的相関型コンテキスト検索手法である。
本手法はFail-to-Passレートをそれぞれ42.0%,52.8%とする。
論文 参考訳(メタデータ) (2026-04-21T08:26:30Z) - CoSearch: Joint Training of Reasoning and Document Ranking via Reinforcement Learning for Agentic Search [51.911048955965136]
CoSearchは多段階推論エージェントと生成ドキュメントランキングモデルを共同でトレーニングするフレームワークである。
この結果から, 推論エージェントと検索システムの協調訓練は, 実現可能であり, 性能も高いことが示唆された。
論文 参考訳(メタデータ) (2026-04-19T17:48:17Z) - Beyond Final Answers: CRYSTAL Benchmark for Transparent Multimodal Reasoning Evaluation [3.23600523782706]
CRYSTAL (Clear Reasoning via Yielded Steps, Traceability, and Logic)は6,372インスタンスの診断ベンチマークである。
本稿では,意味的類似性マッチングによるステップレベルの精度とリコールをスコアするMatch F1と,乱れた推論連鎖をペナルティ化するOrdered Match F1の2つの相補的指標を提案する。
CPR-CurriculumはGRPOによるMatch F1の32%の改善を実現している。
論文 参考訳(メタデータ) (2026-03-13T15:48:15Z) - Beyond Hungarian: Match-Free Supervision for End-to-End Object Detection [6.786987355161583]
提案手法は,DETRを用いた新しい整合性学習手法である。
我々は、符号化された地下構造情報を用いて、クロスアテンション機構を通じてデコーダクエリを探索する。
実験により,提案手法は従来のマッチング処理をバイパスすることを示した。
論文 参考訳(メタデータ) (2026-03-09T15:44:23Z) - Thinking Forward and Backward: Multi-Objective Reinforcement Learning for Retrieval-Augmented Reasoning [137.33138614095435]
Retrieval-augmented Generation (RAG) は、大規模言語モデルにおける幻覚の緩和に有効であることが証明されている。
近年、検索に基づく対話をRAGに組み込んで、リアルタイム検索による反復推論を可能にしている。
提案するBi-RARは,各中間ステップを前方方向と後方方向の両方で共同で評価する,新たな検索拡張推論フレームワークである。
論文 参考訳(メタデータ) (2025-11-12T08:29:39Z) - Beyond Independent Passages: Adaptive Passage Combination Retrieval for Retrieval Augmented Open-Domain Question Answering [7.468615741572889]
Adaptive Passage Combination Retrieval (AdaPCR)は、ブラックボックスLMで応答するオープンドメイン質問のための新しいフレームワークである。
AdaPCRは、経路の組み合わせを検索と再ランクのための単位として考慮することで、通路間の依存関係を明示的にモデル化する。
論文 参考訳(メタデータ) (2025-07-05T15:10:12Z) - Noisy Correspondence Learning with Self-Reinforcing Errors Mitigation [63.180725016463974]
クロスモーダル検索は、実際は精力的な、十分に整合した大規模データセットに依存している。
我々は、新しい雑音対応学習フレームワーク、textbfSelf-textbfReinforcing textbfErrors textbfMitigation(SREM)を導入する。
論文 参考訳(メタデータ) (2023-12-27T09:03:43Z) - Unsupervised Dense Retrieval with Relevance-Aware Contrastive
Pre-Training [81.3781338418574]
関連性を考慮したコントラスト学習を提案する。
我々は、BEIRおよびオープンドメインQA検索ベンチマークにおいて、SOTAアン教師なしコントリバーモデルを一貫して改善する。
本手法は, 目標コーパスの事前訓練後, BM25に打ち勝つだけでなく, 優れた数発学習者として機能する。
論文 参考訳(メタデータ) (2023-06-05T18:20:27Z) - Joint Passage Ranking for Diverse Multi-Answer Retrieval [56.43443577137929]
質問に対する複数の異なる回答をカバーするために、パスの取得を必要とする探索不足の問題であるマルチアンサー検索について検討する。
モデルが別の有効な答えを逃す費用で同じ答えを含む通路を繰り返すべきではないので、このタスクは、検索された通路の共同モデリングを必要とします。
本稿では,再順位に着目したジョイントパス検索モデルであるJPRを紹介する。
回収された通路の合同確率をモデル化するために、JPRは、新しい訓練および復号アルゴリズムを備えた通路のシーケンスを選択する自動回帰リタイナを利用する。
論文 参考訳(メタデータ) (2021-04-17T04:48:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。