論文の概要: Embedding-Based Context-Aware Reranker
- arxiv url: http://arxiv.org/abs/2510.13329v1
- Date: Wed, 15 Oct 2025 09:14:04 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-16 20:13:28.591876
- Title: Embedding-Based Context-Aware Reranker
- Title(参考訳): 埋め込み型コンテキスト認識リランカ
- Authors: Ye Yuan, Mohammad Amin Shabani, Siqi Liu,
- Abstract要約: Retrieval-Augmented Generation (RAG) システムは、下流生成をサポートするためにコーパスから関連する証拠を取得することに依存している。
本稿では,検索したパスの埋め込みを直接操作する軽量なリグレードフレームワークである Embedding-based Context-Aware Reranker (EBCAR) を提案する。
ConTEBベンチマークを用いて,SOTAリランカに対するEBCARの評価を行い,クロスパス推論を必要とする情報検索の有効性を実証した。
- 参考スコア(独自算出の注目度): 11.885086835801523
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Retrieval-Augmented Generation (RAG) systems rely on retrieving relevant evidence from a corpus to support downstream generation. The common practice of splitting a long document into multiple shorter passages enables finer-grained and targeted information retrieval. However, it also introduces challenges when a correct retrieval would require inference across passages, such as resolving coreference, disambiguating entities, and aggregating evidence scattered across multiple sources. Many state-of-the-art (SOTA) reranking methods, despite utilizing powerful large pretrained language models with potentially high inference costs, still neglect the aforementioned challenges. Therefore, we propose Embedding-Based Context-Aware Reranker (EBCAR), a lightweight reranking framework operating directly on embeddings of retrieved passages with enhanced cross-passage understandings through the structural information of the passages and a hybrid attention mechanism, which captures both high-level interactions across documents and low-level relationships within each document. We evaluate EBCAR against SOTA rerankers on the ConTEB benchmark, demonstrating its effectiveness for information retrieval requiring cross-passage inference and its advantages in both accuracy and efficiency.
- Abstract(参考訳): Retrieval-Augmented Generation (RAG) システムは、下流生成をサポートするためにコーパスから関連する証拠を取得することに依存している。
長い文書を複数の短い通路に分割する一般的な方法は、よりきめ細やかな情報検索を可能にする。
しかし、コア推論の解決、エンティティの曖昧化、複数のソースにまたがるエビデンスの集約といった、パス間での正しい検索が要求される場合の課題も導入されている。
多くの最先端のSOTA(State-of-the-art)手法は、潜在的に推論コストの高い強力な大規模事前訓練言語モデルを活用するが、上記の課題は無視されている。
そこで本稿では,文書間の高レベルインタラクションと文書内の低レベル関係の両方をキャプチャするハイブリットアテンション機構と,パスの構造情報を通じて相互パスの理解を深めた,検索されたパスの埋め込みを直接操作する軽量リグレードフレームワークである Embedding-based Context-Aware Reranker (EBCAR) を提案する。
ConTEBベンチマークでEBCARとSOTAリランカを比較し,クロスパス推論を必要とする情報検索の有効性と精度と効率の両面での優位性を実証した。
関連論文リスト
- Retro*: Optimizing LLMs for Reasoning-Intensive Document Retrieval [44.680580989270965]
Retro*は、推論集約的なドキュメント検索のための新しいアプローチである。
本稿では,タスクとドキュメントの関係をモデルが推論できる,ルーブリックに基づく関連性スコアリング機構を提案する。
実験の結果,Retro* は既存の文書検索手法よりも優れていることがわかった。
論文 参考訳(メタデータ) (2025-09-29T14:53:05Z) - Learning Refined Document Representations for Dense Retrieval via Deliberate Thinking [58.69615583599489]
Deliberate Thinking based Retriever (Debater) は、段階的な思考プロセスを導入することで文書表現を強化する新しいアプローチである。
Debaterは、いくつかのベンチマークで既存のメソッドよりも大幅に優れています。
論文 参考訳(メタデータ) (2025-02-18T15:56:34Z) - Enhanced document retrieval with topic embeddings [0.0]
文書検索システムは、検索強化世代(RAG)の出現にともなって、再活性化された関心を経験してきた。
RAGアーキテクチャはLLMのみのアプリケーションよりも幻覚率が低い。
我々は文書の話題情報を考慮した新しいベクトル化手法を考案した。
論文 参考訳(メタデータ) (2024-08-19T22:01:45Z) - Grounding Language Model with Chunking-Free In-Context Retrieval [27.316315081648572]
本稿では,新しいチャンキングフリー・インコンテキスト(CFIC)検索手法を提案する。
論文 参考訳(メタデータ) (2024-02-15T07:22:04Z) - Robust Saliency-Aware Distillation for Few-shot Fine-grained Visual
Recognition [57.08108545219043]
サンプルが少ない新しいサブカテゴリを認識することは、コンピュータビジョンにおいて不可欠で挑戦的な研究課題である。
既存の文献は、ローカルベースの表現アプローチを採用することでこの問題に対処している。
本稿では,ロバスト・サリエンシ・アウェア蒸留法(RSaD)を提案する。
論文 参考訳(メタデータ) (2023-05-12T00:13:17Z) - GERE: Generative Evidence Retrieval for Fact Verification [57.78768817972026]
本稿では,ジェネレーション方式で証拠を検索する最初のシステムであるGEREを提案する。
FEVERデータセットの実験結果は、GEREが最先端のベースラインよりも大幅に改善されていることを示している。
論文 参考訳(メタデータ) (2022-04-12T03:49:35Z) - SAIS: Supervising and Augmenting Intermediate Steps for Document-Level
Relation Extraction [51.27558374091491]
本稿では,関係抽出のための中間ステップ(SAIS)を監督し,拡張することにより,関連コンテキストやエンティティタイプをキャプチャするモデルを明示的に教えることを提案する。
そこで本提案手法は,より効果的な管理を行うため,より優れた品質の関係を抽出するだけでなく,それに対応する証拠をより正確に抽出する。
論文 参考訳(メタデータ) (2021-09-24T17:37:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。