論文の概要: Adaptive ToR: Complexity-Aware Tree-Based Retrieval for Pareto-Optimal Multi-Intent NLU
- arxiv url: http://arxiv.org/abs/2604.24219v1
- Date: Mon, 27 Apr 2026 09:24:10 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-28 17:12:07.876359
- Title: Adaptive ToR: Complexity-Aware Tree-Based Retrieval for Pareto-Optimal Multi-Intent NLU
- Title(参考訳): Adaptive ToR:Pareto-Optimal Multi-Intent NLUのための複雑度対応ツリーベース検索
- Authors: Hee-Kyong Yoo, Wonbae Kim, Hyocheol Ahn,
- Abstract要約: 多言語自然言語理解には、高い精度と計算効率を同時に達成する検索システムが必要である。
本稿では,クエリ特性に基づいた検索トポロジを動的に構成する複雑性を考慮した検索アーキテクチャであるAdaptive Tree-of-Retrieval (Adaptive ToR)を提案する。
- 参考スコア(独自算出の注目度): 0.15293427903448018
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Multi-intent natural language understanding requires retrieval systems that simultaneously achieve high accuracy and computational efficiency, yet existing approaches apply either uniform single-step retrieval that compromises recall or fixed-depth hierarchical decomposition that introduces excessive latency regardless of query complexity. This paper proposes Adaptive Tree-of-Retrieval (Adaptive ToR), a complexity-aware retrieval architecture that dynamically configures retrieval topology based on query characteristics. The system integrates four components: (1) a Query Tree Classifier computing a Query Complexity Index from weighted linguistic signals to route queries to either a rapid single-step path or an adaptive-depth hierarchical path; (2) a Tree-Based Retrieval module that recursively decomposes complex queries into focused sub-queries calibrated to predicted complexity; (3) an Adaptive Pruning Module employing two-stage filtering combining quantitative similarity gating with semantic relevance evaluation to suppress exponential node growth; and (4) a Retrieval Reranking Layer featuring a deduplicator-first pipeline and global LLM rescoring for production efficiency. Evaluation on the NLU++ benchmark (2,693 multi-intent queries across Banking and Hotel domains) yields 29.07% Subset Accuracy and 71.79% Micro-F1, a 9.7% relative improvement over fixed-depth baselines, while reducing latency by 37.6%, LLM invocations by 43.0%, and token consumption by 9.8%. Depth-wise analysis reveals that 26.92% of queries resolve within three seconds (2.45s mean latency) via single-step routing (d=0: 37.9% Subset Accuracy, 74.8% Micro-F1), while token consumption scales by 4.9x across depths, validating complexity-aware resource allocation and establishing Pareto-optimal balance across accuracy, latency, and computational efficiency.
- Abstract(参考訳): 多言語自然言語理解には、高い精度と計算効率を同時に達成する検索システムが必要であるが、既存のアプローチでは、リコールを損なう一様の単一ステップ検索と、クエリの複雑さに関わらず過度なレイテンシをもたらす固定深度階層分解が適用されている。
本稿では,クエリ特性に基づいた検索トポロジを動的に構成する複雑性を考慮した検索アーキテクチャであるAdaptive Tree-of-Retrieval (Adaptive ToR)を提案する。
本システムは,(1)クエリツリー分類器を演算するクエリ複雑度指数(Query Complexity Index)を重み付けした言語信号から,高速な単一ステップの経路あるいは適応深度階層の経路へクエリをルーティングする,(2)複雑なクエリを集中サブクエリに再帰的に分解する,木ベースの検索モジュール(Retrieval Module)を,予測複雑性を基準とした集中サブクエリに分解する,(3)適応型検索モジュール(Adaptive Pruning Module)を,2)意味的関連性評価を併用した定量的な類似性を備えた2段階のフィルタ(Adaptive Pruning Module)を,(Retrieval Recate Layer)を,非重複性パイプライン(deduplicator-first Pipeline)とグローバルLLM再構成により,生産効率を向上させる,という4つのコンポーネントを統合した。
NLU++ベンチマーク(2,693のマルチインテントクエリ)の評価では、サブセット精度が29.07%、Micro-F1が71.79%、固定深度ベースラインが9.7%、レイテンシが37.6%、LCM呼び出しが43.0%、トークン消費が9.8%である。
深さワイズ分析では、クエリの26.92%が1ステップのルーティング(d=0: 37.9% サブセット精度、74.8% マイクロF1)で3秒以内に解決され、トークンの消費は深さの4.9倍にスケールし、複雑さを意識したリソース割り当てを検証し、精度、レイテンシ、計算効率にわたってパレート-最適バランスを確立する。
関連論文リスト
- APEX-EM: Non-Parametric Online Learning for Autonomous Agents via Structured Procedural-Episodic Experience Replay [7.370176470430802]
LLMベースの自律エージェントは、永続的な手続き記憶を欠いている。
我々は,構造化手続き計画の蓄積,検索,再利用を行う非パラメトリックオンライン学習フレームワークであるAPEX-EMを提案する。
論文 参考訳(メタデータ) (2026-03-31T00:24:56Z) - Para-B&B: Load-Balanced Deterministic Parallelization of Solving MIP [50.917107318582715]
MIP(Mixed-integer Programming)は、連続型と整数型の両方の決定変数を組み込むことで線形プログラミングを拡張する。
本稿では,高性能MIPソルバであるHiGHSに対して,決定論的並列分岐結合の完全なオープンソース実装を初めて提案する。
本手法では,ワーカスレッド間で完全なソルバ状態を複製することにより,厳密な決定性を保証する新しいデータ並列アーキテクチャを提案する。
論文 参考訳(メタデータ) (2026-02-10T14:17:53Z) - Reranker Optimization via Geodesic Distances on k-NN Manifolds [0.0]
我々は,k-アネレスト近傍(k-NN)方程式上の測地距離を計算する幾何学的階乗法であるManiscopeを提案する。
Maniscopeは、最も難しい3つのデータセットにおいて、HNSWグラフベースのベースラインを上回っている。
クロスエンコーダのリランカと比較して、Maniscopeは10~45倍のレイテンシで2%の精度で実現している。
論文 参考訳(メタデータ) (2026-01-26T07:55:08Z) - Resonant Sparse Geometry Networks [0.0]
共振器スパース幾何ネットワーク(Resonant Sparse Geometry Networks, RSGN)は, 自己組織型スパーススパース入力依存接続を持つ脳にインスパイアされたアーキテクチャである。
RSGNは、接続強度が測地距離で減衰する学習された双曲空間に計算ノードを埋め込む。
論文 参考訳(メタデータ) (2026-01-26T01:45:51Z) - SimpleMem: Efficient Lifelong Memory for LLM Agents [73.74399447715052]
セマンティックロスレス圧縮に基づく効率的なメモリフレームワークSimpleMemを紹介する。
本稿では,情報密度とトークン利用量の最大化を目的とした3段階パイプラインを提案する。
ベンチマークデータセットを用いた実験により,提案手法は精度,検索効率,推論コストにおいて,ベースラインアプローチを一貫して上回っていることがわかった。
論文 参考訳(メタデータ) (2026-01-05T21:02:49Z) - LLM-guided Hierarchical Retrieval [54.73080745446999]
LATTICEは階層的な検索フレームワークであり、LLMは対数探索の複雑さで大きなコーパスを推論し、ナビゲートすることができる。
LLM誘導探索における中心的な課題は、モデルの関連性判断がノイズが多く、文脈に依存し、階層性に気付かないことである。
我々のフレームワークは、推論集約型BRIGHTベンチマークで最先端のゼロショット性能を実現する。
論文 参考訳(メタデータ) (2025-10-15T07:05:17Z) - Eigen-1: Adaptive Multi-Agent Refinement with Monitor-Based RAG for Scientific Reasoning [53.45095336430027]
暗黙的な検索と構造化された協調を組み合わせた統合フレームワークを開発する。
Humanity's Last Exam (HLE) Bio/Chem Goldでは,48.3%の精度を実現している。
SuperGPQAとTRQAの結果はドメイン間の堅牢性を確認した。
論文 参考訳(メタデータ) (2025-09-25T14:05:55Z) - Hybrid Deep Searcher: Integrating Parallel and Sequential Search Reasoning [57.78245296980122]
本稿では,自然質問から自動生成されるデータセットであるHDS-QA(Hybrid Deep Search QA)を紹介する。
並列化可能な独立サブクエリ(同時に実行可能)と逐次依存サブクエリ(ステップバイステップの解決を必要とする)を組み合わせたハイブリッドホップ質問を含む。
モデルの名称はHybridDeepSearcherで、複数のベンチマークで最先端のベースラインを上回っています。
論文 参考訳(メタデータ) (2025-08-26T15:15:17Z) - TreePO: Bridging the Gap of Policy Optimization and Efficacy and Inference Efficiency with Heuristic Tree-based Modeling [65.46347858249295]
TreePOは自己誘導型ロールアウトアルゴリズムで、シーケンス生成を木構造検索プロセスとして見る。
TreePOは基本的に、探索の多様性を保存または強化しながら、更新毎の計算負担を削減します。
論文 参考訳(メタデータ) (2025-08-24T16:52:37Z) - SymRAG: Efficient Neuro-Symbolic Retrieval Through Adaptive Query Routing [8.775121469887033]
現在のRetrieval-Augmented Generationシステムは一様処理を使用しており、単純なクエリが複雑なマルチホップタスクに似たリソースを消費するので非効率である。
リアルタイム複雑化と負荷評価による適応型クエリルーティングを導入し,シンボル,ニューラル,ハイブリッドの経路を選択するためのフレームワークであるSymRAGを提案する。
論文 参考訳(メタデータ) (2025-06-15T22:35:43Z) - Dspy-based Neural-Symbolic Pipeline to Enhance Spatial Reasoning in LLMs [29.735465300269993]
大規模言語モデル(LLM)は、様々なタスクにまたがる顕著な能力を示してきたが、しばしば空間的推論に苦しむ。
本稿では LLM と Answer Set Programming (ASP) の反復的フィードバックにより LLM の空間推論能力を高める新しいニューラルシンボリックフレームワークを提案する。
我々は、StepGameとSparQAという2つのベンチマークデータセットに対するアプローチを評価した。
論文 参考訳(メタデータ) (2024-11-27T18:04:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。