論文の概要: Hybrid-Vector Retrieval for Visually Rich Documents: Combining Single-Vector Efficiency and Multi-Vector Accuracy
- arxiv url: http://arxiv.org/abs/2510.22215v1
- Date: Sat, 25 Oct 2025 08:27:37 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-28 15:28:14.919807
- Title: Hybrid-Vector Retrieval for Visually Rich Documents: Combining Single-Vector Efficiency and Multi-Vector Accuracy
- Title(参考訳): ビジュアライズドキュメンテーションのためのハイブリッドベクター検索:シングルベクター効率とマルチベクター精度を組み合わせる
- Authors: Juyeon Kim, Geon Lee, Dongwon Choi, Taeuk Kim, Kijung Shin,
- Abstract要約: HEAVENは、視覚的にリッチな文書検索のための2段階のハイブリッドベクトルフレームワークである。
Visually-Summarized Pages上で、単一のベクターメソッドを使用して、候補ページを効率的に検索する。
クエリトークンを言語的に重要度でフィルタリングし、冗長な計算を減らしながら、マルチベクタ方式で候補をリランクする。
- 参考スコア(独自算出の注目度): 36.03315207229038
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Retrieval over visually rich documents is essential for tasks such as legal discovery, scientific search, and enterprise knowledge management. Existing approaches fall into two paradigms: single-vector retrieval, which is efficient but coarse, and multi-vector retrieval, which is accurate but computationally expensive. To address this trade-off, we propose HEAVEN, a two-stage hybrid-vector framework. In the first stage, HEAVEN efficiently retrieves candidate pages using a single-vector method over Visually-Summarized Pages (VS-Pages), which assemble representative visual layouts from multiple pages. In the second stage, it reranks candidates with a multi-vector method while filtering query tokens by linguistic importance to reduce redundant computations. To evaluate retrieval systems under realistic conditions, we also introduce ViMDOC, the first benchmark for visually rich, multi-document, and long-document retrieval. Across four benchmarks, HEAVEN attains 99.87% of the Recall@1 performance of multi-vector models on average while reducing per-query computation by 99.82%, achieving efficiency and accuracy. Our code and datasets are available at: https://github.com/juyeonnn/HEAVEN
- Abstract(参考訳): 視覚的に豊かな文書の検索は、法的発見、科学的検索、企業知識管理といったタスクに不可欠である。
既存のアプローチは、効率は良いが粗いシングルベクター検索と、正確だが計算コストのかかるマルチベクター検索の2つのパラダイムに分類される。
このトレードオフに対処するため、2段階のハイブリッドベクターフレームワークであるHEAVENを提案する。
最初の段階では、HEAVENは、複数のページから代表的な視覚レイアウトを組み立てるVisually-Summarized Pages (VS-Pages)上で、単一のベクター手法を用いて、候補ページを効率的に検索する。
第2段階では、冗長な計算を減らすために、クエリトークンを言語学的重要性でフィルタリングしながら、マルチベクター方式で候補をリランクする。
現実的な条件下での検索システムの評価には、視覚的にリッチでマルチドキュメント、長期文書検索のための最初のベンチマークであるViMDOCも導入する。
4つのベンチマークで、HEAVENは、マルチベクターモデルのRecall@1のパフォーマンスの99.87%を平均で達成し、クエリごとの計算を99.82%削減し、効率と精度を達成する。
私たちのコードとデータセットは、https://github.com/juyeonnn/HEAVEN.comで公開されています。
関連論文リスト
- Investigating Multi-layer Representations for Dense Passage Retrieval [46.25475369974163]
文書の表現を構成するために多層表現(MLR)を示す。
まず,異なる層における表現がマルチベクトル検索条件下でのMLRの性能に与える影響について検討する。
本稿では,マルチベクタモデルから単一ベクタモデルへのプーリング戦略を活用することで,検索効率を向上させることを提案する。
論文 参考訳(メタデータ) (2025-09-28T13:00:53Z) - MUVERA: Multi-Vector Retrieval via Fixed Dimensional Encodings [15.275864151890511]
マルチベクトル探索を単一ベクトル類似性探索に還元する検索機構であるMUVERA(MUlti-VEctor Retrieval Algorithm)を導入する。
MUVERAはBEIR検索データセットの多種多様なセットに対して、一貫して優れたエンドツーエンドのリコールとレイテンシを実現する。
論文 参考訳(メタデータ) (2024-05-29T20:40:20Z) - Multimodal Learned Sparse Retrieval with Probabilistic Expansion Control [66.78146440275093]
学習検索(LSR)は、クエリとドキュメントを疎語彙ベクトルにエンコードするニューラルネットワークのファミリーである。
テキスト画像検索に焦点をあて,マルチモーダル領域へのLSRの適用について検討する。
LexLIPやSTAIRのような現在のアプローチでは、大規模なデータセットで複雑なマルチステップのトレーニングが必要です。
提案手法は, 密度ベクトルを凍結密度モデルからスパース語彙ベクトルへ効率的に変換する。
論文 参考訳(メタデータ) (2024-02-27T14:21:56Z) - CFIR: Fast and Effective Long-Text To Image Retrieval for Large Corpora [3.166549403591528]
本稿では,高速かつ効率的な画像検索のための2段階の粗度指数共有検索(CFIR)フレームワークを提案する。
CFIRは、Recall@1000で既存のMLLMを最大11.06%上回り、トレーニング時間と検索時間をそれぞれ68.75%、99.79%削減している。
論文 参考訳(メタデータ) (2024-02-23T11:47:16Z) - List-aware Reranking-Truncation Joint Model for Search and
Retrieval-augmented Generation [80.12531449946655]
本稿では,2つのタスクを同時に実行可能なRe rank-Truncation joint model(GenRT)を提案する。
GenRTは、エンコーダ-デコーダアーキテクチャに基づく生成パラダイムによるリランクとトランケーションを統合している。
提案手法は,Web検索および検索拡張LLMにおけるリランクタスクとトラルケーションタスクの両方においてSOTA性能を実現する。
論文 参考訳(メタデータ) (2024-02-05T06:52:53Z) - CITADEL: Conditional Token Interaction via Dynamic Lexical Routing for
Efficient and Effective Multi-Vector Retrieval [72.90850213615427]
マルチベクター検索法はスパース(例えばBM25)と高密度(例えばDPR)レトリバーの利点を組み合わせたものである。
これらの手法は桁違いに遅く、単ベクトルの手法に比べてインデックスを格納するのにはるかに多くのスペースを必要とする。
動的語彙ルーティング(CITADEL)による条件付きトークンの相互作用を,効率的かつ効率的なマルチベクタ検索のために提案する。
論文 参考訳(メタデータ) (2022-11-18T18:27:35Z) - UnifieR: A Unified Retriever for Large-Scale Retrieval [84.61239936314597]
大規模な検索は、クエリを与えられた巨大なコレクションから関連ドキュメントをリコールすることである。
事前学習型言語モデル(PLM)に基づく最近の検索手法は,高密度ベクターあるいはレキシコンに基づくパラダイムに大別することができる。
本論文では,高密度ベクトルとレキシコンに基づく検索を2つの表現能力を持つ1つのモデルで統合する学習フレームワークUnifieRを提案する。
論文 参考訳(メタデータ) (2022-05-23T11:01:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。