論文の概要: SelRoute: Query-Type-Aware Routing for Long-Term Conversational Memory Retrieval
- arxiv url: http://arxiv.org/abs/2604.02431v1
- Date: Thu, 02 Apr 2026 18:02:59 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-06 17:20:24.161461
- Title: SelRoute: Query-Type-Aware Routing for Long-Term Conversational Memory Retrieval
- Title(参考訳): SelRoute: 長期会話型メモリ検索のためのクエリ型アウェアルーティング
- Authors: Matthew McKee,
- Abstract要約: SelRouteは、クエリタイプに基づいて、各クエリを専用のパイプラインにルーティングするフレームワークである。
LongMemEval_Mでは、bge-base-en-v1.5 (109Mパラメータ)で0.800、bge-small-en-v1.5 (109Mパラメータ)で0.786のRecall@5を達成する。
FTS5のみを使用したゼロMLベースラインは0.692のNDCG@5を達成する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Retrieving relevant past interactions from long-term conversational memory typically relies on large dense retrieval models (110M-1.5B parameters) or LLM-augmented indexing. We introduce SelRoute, a framework that routes each query to a specialized retrieval pipeline -- lexical, semantic, hybrid, or vocabulary-enriched -- based on its query type. On LongMemEval_M (Wu et al., 2024), SelRoute achieves Recall@5 of 0.800 with bge-base-en-v1.5 (109M parameters) and 0.786 with bge-small-en-v1.5 (33M parameters), compared to 0.762 for Contriever with LLM-generated fact keys. A zero-ML baseline using SQLite FTS5 alone achieves NDCG@5 of 0.692, already exceeding all published baselines on ranking quality -- a gap we attribute partly to implementation differences in lexical retrieval. Five-fold stratified cross-validation confirms routing stability (CV gap of 1.3-2.4 Recall@5 points; routes stable for 4/6 query types across folds). A regex-based query-type classifier achieves 83% effective routing accuracy, and end-to-end retrieval with predicted types (Recall@5 = 0.689) still outperforms uniform baselines. Cross-benchmark evaluation on 8 additional benchmarks spanning 62,000+ instances -- including MSDialog, LoCoMo, QReCC, and PerLTQA -- confirms generalization without benchmark-specific tuning, while exposing a clear failure mode on reasoning-intensive retrieval (RECOR Recall@5 = 0.149) that bounds the claim. We also identify an enrichment-embedding asymmetry: vocabulary expansion at storage time improves lexical search but degrades embedding search, motivating per-pipeline enrichment decisions. The full system requires no GPU and no LLM inference at query time.
- Abstract(参考訳): 長期の会話記憶から関連する過去のインタラクションを取得するには、通常、大きな密度の検索モデル(110M-1.5Bパラメータ)やLLM拡張インデックス化に依存する。
SelRouteは、クエリタイプに基づいて、各クエリを、レキシカル、セマンティック、ハイブリッド、ボキャブラリエンリッチ(vocabulary-enriched)という特別なパイプラインにルーティングするフレームワークです。
LongMemEval_M (Wu et al , 2024)では、SelRouteは、bge-base-en-v1.5 (109Mパラメータ)で0.800のRecall@5、bge-small-en-v1.5 (33Mパラメータ)で0.786を達成する。
SQLite FTS5 を使用したゼロMLベースラインは NDCG@5 の 0.692 を達成しており、すでにランク付け品質に関するすべてのベースラインを越えている。
5倍の階層化されたクロスバリデーションはルーティングの安定性を確認する(CVギャップは1.3-2.4 Recall@5ポイント;ルートはフォールドで4/6のクエリタイプで安定している)。
regexベースのクエリ型分類器は、83%の効果的なルーティング精度を実現し、予測された型(Recall@5 = 0.689)によるエンドツーエンド検索は、依然として均一なベースラインを上回っている。
MSDialog、LoCoMo、QReCC、PerLTQAを含む62,000以上のインスタンスにまたがる8つのベンチマークに対するベンチマークのクロスベンチマーク評価は、ベンチマーク固有のチューニングなしでの一般化を確認し、請求を拘束する推論集約検索(RECOR Recall@5 = 0.149)の明確な障害モードを公開する。
記憶時の語彙展開は語彙探索を改善するが、埋め込み探索を低下させ、ピペリンごとのエンリッチメント決定を動機付ける。
完全なシステムはGPUを必要とせず、クエリ時にLLM推論を必要としない。
関連論文リスト
- SmartSearch: How Ranking Beats Structure for Conversational Memory Retrieval [0.0]
SmartSearchは完全に決定論的パイプラインを使用して、生の非構造化会話履歴から検索する。
SmartSearchはLoCoMoで93.5%、LongMemEval-Sベンチマークで88.4%を達成した。
論文 参考訳(メタデータ) (2026-03-16T17:53:21Z) - Resource-Efficient Iterative LLM-Based NAS with Feedback Memory [49.44875022114861]
ニューラルアーキテクチャサーチ(NAS)はネットワーク設計を自動化するが、従来の手法ではかなりの計算資源を必要とする。
本稿では,大規模言語モデル(LLM)を活用して,畳み込みニューラルネットワークアーキテクチャを反復的に生成し,評価し,洗練するクローズドループパイプラインを提案する。
論文 参考訳(メタデータ) (2026-03-12T16:00:22Z) - Domain-Adaptive and Scalable Dense Retrieval for Content-Based Recommendation [0.0]
本稿では,Amazon Reviews 2023 (Fashion) サブセットを微調整した2-towerバイエンコーダをベースとした,スケーラブルな高密度検索システムを提案する。
我々は、レビューテキスト(クエリプロキシとして)とアイテムメタデータ(ポジティブドキュメントとして)からトレーニングペアを構築し、500トークンの最大シーケンス長で50,000のサンプルインタラクションを微調整する。
826,402のカタログ項目に対するレビュー・ツー・タイトルのベンチマークでは、Recall@10が0.26(BM25)から0.66に改善されました。
論文 参考訳(メタデータ) (2026-01-31T20:58:23Z) - CORE-T: COherent REtrieval of Tables for Text-to-SQL [91.76918495375384]
CORE-Tはスケーラブルでトレーニング不要なフレームワークで、テーブルに目的のメタデータを付加し、軽量なテーブル互換キャッシュをプリコンプリートする。
バード、スパイダー、MMQAを越えて、CORE-Tはテーブル選択F1を最大22.7ポイント改善し、最大42%のテーブルを検索する。
論文 参考訳(メタデータ) (2026-01-19T14:51:23Z) - MemSearcher: Training LLMs to Reason, Search and Manage Memory via End-to-End Reinforcement Learning [73.27233666920618]
本稿では,メモリを反復的に保持し,現在のターンと組み合わせたエージェントワークフローであるMemSearcherを提案する。
それぞれのターンで、MemSearcherはユーザーの質問をメモリに融合させ、推論トレースを生成し、検索アクションを実行し、メモリを更新してタスクの解決に必要な情報のみを保持する。
我々は,MemSearcher Agents の推論,検索戦略,メモリ管理を協調的に最適化する,エンドツーエンドの RL フレームワークである Multi-context GRPO を紹介する。
論文 参考訳(メタデータ) (2025-11-04T18:27:39Z) - LLM-guided Hierarchical Retrieval [54.73080745446999]
LATTICEは階層的な検索フレームワークであり、LLMは対数探索の複雑さで大きなコーパスを推論し、ナビゲートすることができる。
LLM誘導探索における中心的な課題は、モデルの関連性判断がノイズが多く、文脈に依存し、階層性に気付かないことである。
我々のフレームワークは、推論集約型BRIGHTベンチマークで最先端のゼロショット性能を実現する。
論文 参考訳(メタデータ) (2025-10-15T07:05:17Z) - Guarded Query Routing for Large Language Models [2.2349474636722317]
ガードドクエリルーティング問題について検討し、最初にガードドクエリルーティングベンチマーク(GQR-Bench)を導入する。
その結果,ドメイン外検出能力が向上したWideMLPでは,精度(88%)と速度(4ms)のトレードオフが最良であることがわかった。
本研究は,LLMを(保護された)クエリルーティングに自動的に依存させることに挑戦し,実用的なアプリケーションに具体的なレコメンデーションを提供する。
論文 参考訳(メタデータ) (2025-05-20T15:46:59Z) - Allies: Prompting Large Language Model with Beam Search [107.38790111856761]
本研究では,ALIESと呼ばれる新しい手法を提案する。
入力クエリが与えられた場合、ALLIESはLLMを活用して、元のクエリに関連する新しいクエリを反復的に生成する。
元のクエリのスコープを反復的に精錬して拡張することにより、ALLIESは直接検索できない隠れた知識をキャプチャし、利用する。
論文 参考訳(メタデータ) (2023-05-24T06:16:44Z) - Large Language Models are Strong Zero-Shot Retriever [89.16756291653371]
ゼロショットシナリオにおける大規模検索に大規模言語モデル(LLM)を適用するための簡単な手法を提案する。
我々の手法であるRetriever(LameR)は,LLM以外のニューラルモデルに基づいて構築された言語モデルである。
論文 参考訳(メタデータ) (2023-04-27T14:45:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。