論文の概要: Decoupling Search from Reasoning: A Vendor-Agnostic Grounding Architecture for LLM Agents
- arxiv url: http://arxiv.org/abs/2606.18947v1
- Date: Wed, 17 Jun 2026 11:30:39 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-18 17:16:51.130158
- Title: Decoupling Search from Reasoning: A Vendor-Agnostic Grounding Architecture for LLM Agents
- Title(参考訳): 推論から検索を分離する: LLMエージェントのためのベンダー非依存のグラウンドディングアーキテクチャ
- Authors: Emmanuel Aboah Boateng, Kyle MacDonald, Amardeep Kumar, Siddharth Kodwani, Sudeep Das,
- Abstract要約: 我々は、ベンダーに依存しない境界であるDecoupled Search Grounding (DSG)について述べる。
DSGは検索コストを98%以上削減しながら、eコマースのクエリに基づくワークロードに対して、ネイティブ検索の精度をわずかに上回っている。
- 参考スコア(独自算出の注目度): 1.8969868190153276
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Production LLM agents increasingly depend on real-time search, yet native search grounding bundles retrieval policy, provider choice, evidence injection, cost, latency, and generation behavior behind a single model-provider boundary. This coupling makes grounding hard to inspect, tune, reuse, or port, and can trigger Search-Induced Verbosity that breaks strict output contracts. We present Decoupled Search Grounding (DSG), a vendor-agnostic boundary that moves grounding outside the reasoning model through an MCP-compatible gateway, exposing provider routing, source-aware context rendering, configured fallback, retrieval-depth control, and exact plus semantic caching as first-class controls. Across five frontier models on SimpleQA, FreshQA, and HotpotQA, native search leads on recency-sensitive FreshQA, but DSG exposes a stronger frontier when control matters: on SimpleQA it nearly matches native accuracy (86.1% vs. 87.7%) at 91% lower search cost, preserves concise answer contracts, and reaches a 99.4% warm-cache hit rate with 68% lower latency. Deployed as a shared production grounding layer for large-scale agentic workloads with interchangeable models, DSG matches or slightly exceeds native-search accuracy on an e-commerce query-understanding (QIU) workload while cutting search cost by over 98%. Real-time grounding is best treated as an optimizable interface boundary, not a fixed model feature.
- Abstract(参考訳): プロダクションLLMエージェントは、リアルタイム検索にますます依存するが、ネイティブ検索基盤バンドルは、検索ポリシー、プロバイダの選択、エビデンスインジェクション、コスト、レイテンシ、単一のモデル-プロジェクタ境界の背後にある生成動作に頼っている。
この結合は、検査、チューニング、再利用、移植を困難にし、厳格な出力契約を破る検索誘発のVerbosityをトリガーする。
我々は、ベンダーに依存しないバウンダリであるDecoupled Search Grounding (DSG)を提案する。このバウンダリは、MPP互換ゲートウェイを通じて推論モデル外を移動し、プロバイダルーティング、ソース認識コンテキストレンダリング、設定されたフォールバック、検索深度制御、およびファーストクラスコントロールとしての正確なプラスセマンティックキャッシングを提供する。
SimpleQA、FreshQA、HotpotQAの5つのフロンティアモデルにおいて、ネイティブ検索は遅延に敏感なFreshQAを導くが、DSGはコントロール上の問題においてより強力なフロンティアを公開する:SimpleQAでは、検索コストが91%低い(86.1%対87.7%)。
大規模なエージェントワークロードと交換可能なモデルを備えた共有運用基盤レイヤとしてデプロイされたDSGは、Eコマースクエリアンダーウンディング(QIU)ワークロード上でネイティブ検索の精度をわずかに上回り、検索コストを98%以上削減する。
リアルタイムグラウンドティングは、固定モデル機能ではなく、最適化可能なインターフェース境界として扱われる。
関連論文リスト
- COAgents: Multi-Agent Framework to Learn and Navigate Routing Problems Search Space [18.154961815020155]
車両ルーティング問題(VRP)は、多くの現実世界システムに必須であるが、その複雑さのため、大規模に拡張可能である。
検索プロセスをグラフとしてモデル化する協調型マルチエージェントフレームワークである textbfCOAgents を紹介する。
実験の結果、COAgentsはCVRPのいくつかの学習ベースラインと競合し続けており、より困難なVRPTWインスタンス上での学習ベースの手法の中で、新しい最先端の技術を定めている。
論文 参考訳(メタデータ) (2026-05-20T02:07:10Z) - Beyond Inference-Time Search: Reinforcement Learning Synthesizes Reusable Solvers [0.0]
大規模言語モデル(LLM)は一般的に、各インスタンスを個別に解決する推論時プロシージャとして最適化にアプローチする。
本稿では,制約付きクナプサックの制御変種であるSDS(Synergistic Dependency Selection)について考察する。
Qwen2.5-Coder-14B-Instruct with Group Relative Policy Optimization using a feasibility-gated reward and light Structure scaffolding。
論文 参考訳(メタデータ) (2026-05-18T13:21:40Z) - Beyond Semantic Similarity: Rethinking Retrieval for Agentic Search via Direct Corpus Interaction [127.64173950476702]
エージェントが直接、汎用端末ツールを用いて、生コーパスを直接検索する直接コーパス間相互作用(DCI)について検討する。
このアプローチではオフラインインデックスを必要とせず、ローカルコーパスの進化に自然に適応する。
IRベンチマークとエンドツーエンドのエージェント検索タスク全体にわたって、この単純なセットアップは、強いスパース、密度、リランクベースラインよりも大幅に優れています。
論文 参考訳(メタデータ) (2026-05-03T19:13:11Z) - Agentic Spatio-Temporal Grounding via Collaborative Reasoning [80.83158605034465]
時間的ビデオグラウンド(Temporal Video Grounding)は、テキストクエリが与えられたビデオ内の対象物または人の時間的チューブを検索することを目的としている。
本稿では,STVGの課題に対して,オープンワールドおよびトレーニングフリーシナリオに向けたエージェント時空間グラウンド(ASTG)フレームワークを提案する。
具体的には、現代多言語モデル(MLLM)を活用した2つの特殊エージェントSRA(Spatial Reasoning Agent)とTRA(Temporal Reasoning Agent)である。
人気のあるベンチマークの実験は、既存の弱教師付きおよびゼロショットアプローチをマージンで上回る提案手法の優位性を実証している。
論文 参考訳(メタデータ) (2026-02-10T10:16:27Z) - Bridging the Perception Gap: A Lightweight Coarse-to-Fine Architecture for Edge Audio Systems [10.143590597259792]
CoFi-Agentはエッジサーバとゲートウェイをターゲットにしたハイブリッドアーキテクチャである。
高速な局所認識を行い、不確実性が検出された場合にのみ条件付き法医学的洗練をトリガーする。
MMARのベンチマークでは、CoFi-Agentは精度を27.20%から53.60%に改善し、常にオンのパイプラインよりも精度と効率のトレードオフを実現している。
論文 参考訳(メタデータ) (2026-01-22T05:57:25Z) - RSAgent: Learning to Reason and Act for Text-Guided Segmentation via Multi-Turn Tool Invocations [52.752467948588816]
エージェント型マルチモーダル大規模言語モデル(MLLM)であるRSAgentを提案する。
RSAgentはセグメンテーション・ツールボックスをクエリし、視覚的フィードバックを観察し、歴史的観測を用いて空間仮説を改訂し、ターゲットを再ローカライズし、反復的にマスクを洗練させる。
RSAgentはReasonSegテストで66.5% gIoUのゼロショット性能を達成し、Seg-Zero-7Bを9%改善し、RefCOCOgで81.5% cIoUに達した。
論文 参考訳(メタデータ) (2025-12-30T06:50:11Z) - Search Wisely: Mitigating Sub-optimal Agentic Searches By Reducing Uncertainty [21.96443267949563]
エージェント検索型Augmented Generation (RAG) システムは,動的かつ多段階の推論と情報検索を可能にし,Large Language Models (LLM) を強化する。
これらのシステムは、オーバーサーチ(冗長な情報を取得する)やアンダーサーチ(必要な情報を取得するのに失敗する)のような準最適探索行動を示すことが多い。
この研究は、これらの振る舞いを公式に定義し、定量化し、複数のQAデータセットとエージェントRAGシステムにまたがるそれらの頻度を明らかにする。
論文 参考訳(メタデータ) (2025-05-22T20:57:56Z) - ETS: Efficient Tree Search for Inference-Time Scaling [61.553681244572914]
テストタイムの計算スケーリングにおいて有望なアプローチのひとつは、プロセス報酬モデルに対する検索である。
木探索過程における軌跡の多様性は、多様性の増大がさらなる探索を促進するため、探索の精度に影響を与える。
本稿では,冗長なトラジェクトリを抽出し,必要な多様なトラジェクトリを維持しながら,KVの共有を促進する効率的なツリー探索(ETS)を提案する。
論文 参考訳(メタデータ) (2025-02-19T09:30:38Z) - Single-Stage Visual Relationship Learning using Conditional Queries [60.90880759475021]
TraCQは、マルチタスク学習問題とエンティティペアの分布を回避する、シーングラフ生成の新しい定式化である。
我々は,DETRをベースとしたエンコーダ-デコーダ条件付きクエリを用いて,エンティティラベル空間を大幅に削減する。
実験結果から、TraCQは既存のシングルステージシーングラフ生成法よりも優れており、Visual Genomeデータセットの最先端の2段階メソッドを多く上回っていることがわかった。
論文 参考訳(メタデータ) (2023-06-09T06:02:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。