論文の概要: Reranker Optimization via Geodesic Distances on k-NN Manifolds
- arxiv url: http://arxiv.org/abs/2602.15860v1
- Date: Mon, 26 Jan 2026 07:55:08 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-23 12:01:13.662975
- Title: Reranker Optimization via Geodesic Distances on k-NN Manifolds
- Title(参考訳): k-NN多様体上の測地距離によるリランカ最適化
- Authors: Wen G. Gong,
- Abstract要約: 我々は,k-アネレスト近傍(k-NN)方程式上の測地距離を計算する幾何学的階乗法であるManiscopeを提案する。
Maniscopeは、最も難しい3つのデータセットにおいて、HNSWグラフベースのベースラインを上回っている。
クロスエンコーダのリランカと比較して、Maniscopeは10~45倍のレイテンシで2%の精度で実現している。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Current neural reranking approaches for retrieval-augmented generation (RAG) rely on cross-encoders or large language models (LLMs), requiring substantial computational resources and exhibiting latencies of 3-5 seconds per query. We propose Maniscope, a geometric reranking method that computes geodesic distances on k-nearest neighbor (k-NN) manifolds constructed over retrieved document candidates. This approach combines global cosine similarity with local manifold geometry to capture semantic structure that flat Euclidean metrics miss. Evaluating on eight BEIR benchmark datasets (1,233 queries), Maniscope outperforms HNSW graph-based baseline on the three hardest datasets (NFCorpus: +7.0%, TREC-COVID: +1.6%, AorB: +2.8% NDCG@3) while being 3.2x faster (4.7 ms vs 14.8 ms average). Compared to cross-encoder rerankers, Maniscope achieves within 2% accuracy at 10-45x lower latency. On TREC-COVID, LLM-Reranker provides only +0.5% NDCG@3 improvement over Maniscope at 840x higher latency, positioning Maniscope as a practical alternative for real-time RAG deployment. The method requires O(N D + M^2 D + M k log k) complexity where M << N , enabling sub-10 ms latency. We plan to release Maniscope as open-source software.
- Abstract(参考訳): 現在のRAG(Research-augmented Generation)に対するニューラルリグレードのアプローチは、クロスエンコーダや大規模言語モデル(LLM)に依存しており、相当な計算資源を必要とし、クエリ毎に3~5秒のレイテンシを示す。
得られた文書候補の上に構築されたk-アネレスト近傍(k-NN)多様体上の測地距離を計算する幾何学的階乗法であるManiscopeを提案する。
このアプローチは、グローバルコサイン類似性と局所多様体幾何学を組み合わせることで、平坦ユークリッド計量が見逃す意味構造を捉える。
8つのBEIRベンチマークデータセット(1,233クエリ)を評価し、Maniscopeは3つの最も難しいデータセット(NFCorpus: +7.0%、TREC-COVID: +1.6%、AorB: +2.8% NDCG@3)でHNSWグラフベースのベースラインのパフォーマンスを3.2倍(平均4.7ms×14.8ms)に向上させる。
クロスエンコーダのリランカと比較して、Maniscopeは10~45倍のレイテンシで2%の精度で実現している。
TREC-COVIDでは、LLM-RerankerがManiscopeよりも0.5%のNDCG@3を840倍高いレイテンシで提供し、ManiscopeをリアルタイムRAGデプロイメントの実用的な代替品として位置づけている。
この方法は、O(N D + M^2 D + M k log k) の複雑さを必要とする。
Maniscopeをオープンソースソフトウェアとしてリリースする予定です。
関連論文リスト
- HARP-NeXt: High-Speed and Accurate Range-Point Fusion Network for 3D LiDAR Semantic Segmentation [39.58684038370709]
LiDARセマンティックセグメンテーションは、自動運転車や移動ロボットにとって不可欠である。
従来の最先端の手法は、精度とスピードのトレードオフに直面していることが多い。
本稿では,高速かつ高精度なLiDARセマンティックセグメンテーションネットワークであるHARP-NeXtを紹介する。
論文 参考訳(メタデータ) (2025-10-08T10:46:07Z) - Adaptive Monitoring and Real-World Evaluation of Agentic AI Systems [3.215065407261898]
大規模言語モデルと外部ツールを組み合わせたマルチエージェントシステムは、研究機関からハイテイクドメインへと急速に移行している。
この「先進的な」続編は、アルゴリズムのインスタンス化や経験的な証拠を提供することで、そのギャップを埋める。
AMDMは擬似ゴールドリフトで異常検出遅延を12.3秒から5.6秒に減らし、偽陽性率を4.5%から0.9%に下げる。
論文 参考訳(メタデータ) (2025-08-28T15:52:49Z) - S*: Test Time Scaling for Code Generation [55.11863577956177]
コード生成のための最初のハイブリッドテストタイムスケーリングフレームワークであるS*を提案する。
S*は生成されたコードのカバレッジと選択精度を大幅に改善する。
論文 参考訳(メタデータ) (2025-02-20T09:18:53Z) - FusionLLM: A Decentralized LLM Training System on Geo-distributed GPUs with Adaptive Compression [55.992528247880685]
分散トレーニングは、システム設計と効率に関する重要な課題に直面します。
大規模深層ニューラルネットワーク(DNN)のトレーニング用に設計・実装された分散トレーニングシステムFusionLLMを提案する。
本システムと手法は,収束性を確保しつつ,ベースライン法と比較して1.45~9.39倍の高速化を実現可能であることを示す。
論文 参考訳(メタデータ) (2024-10-16T16:13:19Z) - Hybrid-Task Meta-Learning: A GNN Approach for Scalable and Transferable Bandwidth Allocation [50.96751567777229]
ユーザ数に応じてスケーラブルで,異なる通信シナリオに転送可能な,ディープラーニングベースの帯域割り当てポリシを開発する。
スケーラビリティをサポートするために、帯域割り当てポリシーはグラフニューラルネットワーク(GNN)によって表現される。
我々は,GNNの初期パラメータを異なる通信シナリオで学習するハイブリッドタスクメタ学習(HML)アルゴリズムを開発した。
論文 参考訳(メタデータ) (2023-12-23T04:25:12Z) - Flexible Channel Dimensions for Differentiable Architecture Search [50.33956216274694]
本稿では,効率的な動的チャネル割当アルゴリズムを用いた新しい微分可能なニューラルアーキテクチャ探索法を提案する。
提案するフレームワークは,タスク精度と推論遅延において,従来の手法と等価なDNNアーキテクチャを見つけることができることを示す。
論文 参考訳(メタデータ) (2023-06-13T15:21:38Z) - Back to MLP: A Simple Baseline for Human Motion Prediction [59.18776744541904]
本稿では、歴史的に観察されたシーケンスから将来の身体のポーズを予測することによる、人間の動作予測の課題に取り組む。
これらの手法の性能は、0.14Mパラメータしか持たない軽量で純粋にアーキテクチャアーキテクチャによって超えることができることを示す。
Human3.6M, AMASS, 3DPWデータセットの徹底的な評価は, siMLPeをダブした我々の手法が, 他のアプローチよりも一貫して優れていることを示している。
論文 参考訳(メタデータ) (2022-07-04T16:35:58Z) - Res-GCNN: A Lightweight Residual Graph Convolutional Neural Networks for
Human Trajectory Forecasting [0.0]
ペデストリアンの対話的挙動をモデル化した残差グラフ畳み込みニューラルネットワーク(Res-GCNN)を提案する。
その結果、最終変位誤差(FDE)が0.65mに達すると、アートの状態を13.3%改善することが示された。
コードはGitHubで公開されている。
論文 参考訳(メタデータ) (2020-11-18T11:18:16Z) - Enhancing Geometric Factors in Model Learning and Inference for Object
Detection and Instance Segmentation [91.12575065731883]
境界ボックス回帰および非最大抑圧(NMS)における幾何学的要素の強化を目的とした完全IoU損失とクラスタNMSを提案する。
CIoU損失を用いたディープラーニングモデルのトレーニングは、広く採用されている$ell_n$-norm損失とIoUベースの損失と比較して、一貫性のあるAPとARの改善をもたらす。
クラスタ-NMSは、純粋なGPU実装のため非常に効率的であり、APとARの両方を改善するために幾何学的要素を組み込むことができる。
論文 参考訳(メタデータ) (2020-05-07T16:00:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。