論文の概要: Agentic Multi-Source Grounding for Enhanced Query Intent Understanding: A DoorDash Case Study
- arxiv url: http://arxiv.org/abs/2603.01486v1
- Date: Mon, 02 Mar 2026 05:51:05 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-03 19:50:56.704848
- Title: Agentic Multi-Source Grounding for Enhanced Query Intent Understanding: A DoorDash Case Study
- Title(参考訳): 拡張クエリインテント理解のためのエージェントマルチソースグラウンド:DoorDashケーススタディ
- Authors: Emmanuel Aboah Boateng, Kyle MacDonald, Akshad Viswanathan, Sudeep Das,
- Abstract要約: 本稿では,両方の障害モードに対処するエージェント・マルチソース・グラウンドドシステムを提案する。
モデルは単一のラベルを予測するのではなく、順序付けられたマルチインテントセットを出力する。
システムはプロダクションにデプロイされ、毎日の検索インプレッションの95%以上を処理している。
- 参考スコア(独自算出の注目度): 0.8924669503280332
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Accurately mapping user queries to business categories is a fundamental Information Retrieval challenge for multi-category marketplaces, where context-sparse queries such as "Wildflower" exhibit intent ambiguity, simultaneously denoting a restaurant chain, a retail product, and a floral item. Traditional classifiers force a winner-takes-all assignment, while general-purpose LLMs hallucinate unavailable inventory. We introduce an Agentic Multi-Source Grounded system that addresses both failure modes by grounding LLM inference in (i) a staged catalog entity retrieval pipeline and (ii) an agentic web-search tool invoked autonomously for cold-start queries. Rather than predicting a single label, the model emits an ordered multi-intent set, resolved by a configurable disambiguation layer that applies deterministic business policies and is designed for extensibility to personalization signals. This decoupled design generalizes across domains, allowing any marketplace to supply its own grounding sources and resolution rules without modifying the core architecture. Evaluated on DoorDash's multi-vertical search platform, the system achieves +10.9pp over the ungrounded LLM baseline and +4.6pp over the legacy production system. On long-tail queries, incremental ablations attribute +8.3pp to catalog grounding, +3.2pp to agentic web search grounding, and +1.5pp to dual intent disambiguation, yielding 90.7% accuracy (+13.0pp over baseline). The system is deployed in production, serving over 95% of daily search impressions, and establishes a generalizable paradigm for applications requiring foundation models grounded in proprietary context and real-time web knowledge to resolve ambiguous, context-sparse decision problems at scale.
- Abstract(参考訳): ユーザクエリをビジネスカテゴリに正確にマッピングすることは、"Wildflower"のようなコンテキストスパースなクエリが意図の曖昧さを示し、レストランチェーン、小売商品、花のアイテムを同時に表現する、マルチカテゴリのマーケットプレースにとって、基本的な情報検索チャレンジである。
伝統的な分類法では、受賞者全員の割り当てを強制し、汎用LLMは入手できない在庫を幻覚させる。
LLM推論をグラウンド化することで、両方の障害モードに対処するエージェントマルチソースグラウンドドシステムを提案する。
i)ステージ化されたカタログエンティティ検索パイプライン及び
(II) コールドスタートクエリを自律的に起動するエージェントWeb検索ツール。
モデルは、単一のラベルを予測するのではなく、決定論的ビジネスポリシーを適用し、パーソナライズ信号の拡張性のために設計された、設定可能な曖昧化層によって解決された順序付き多元集合を出力する。
この分離された設計はドメインをまたいで一般化され、どのマーケットプレースもコアアーキテクチャを変更することなく、独自の基盤となるソースと解決ルールを供給できる。
DoorDashのマルチバーティカル検索プラットフォームで評価され、旧来のLLMベースラインで+10.9pp、旧来のプロダクションシステムで+4.6ppを達成した。
ロングテールクエリでは、インクリメンタルアブレーション属性+8.3ppがカタロググラウンド化、+3.2ppがエージェント検索グラウンド化、+1.5ppが二重意図の曖昧化、90.7%が精度(+13.0ppがベースライン上)である。
システムは本番環境に展開され、日々の検索インプレッションの95%以上を処理し、プロプライエタリなコンテキストとリアルタイムなWeb知識に基づく基礎モデルを必要とするアプリケーションのための一般化可能なパラダイムを確立し、大規模かつ曖昧な意思決定問題を解決する。
関連論文リスト
- LLM-based Semantic Search for Conversational Queries in E-commerce [1.3645712130536118]
会話クエリからユーザ意図をキャプチャするLLMベースのセマンティック検索フレームワークを提案する。
本フレームワークは,実世界のデータセットのベースラインアプローチと比較して,様々な設定において高い精度とリコールを実現する。
論文 参考訳(メタデータ) (2026-01-23T06:35:28Z) - OFA-MAS: One-for-All Multi-Agent System Topology Design based on Mixture-of-Experts Graph Generative Models [57.94189874119267]
マルチエージェントシステム(MAS)は複雑な問題を解決するための強力なパラダイムを提供する。
現在のグラフ学習に基づく設計手法は、しばしば「1対1」のパラダイムに準拠している。
自然言語で記述されたタスクに対して適応的な協調グラフを生成する一対一のフレームワークOFA-TADを提案する。
論文 参考訳(メタデータ) (2026-01-19T12:23:44Z) - A Chain-of-Thought Approach to Semantic Query Categorization in e-Commerce Taxonomies [1.1957890510931164]
Chain-of-Thought(CoT)パラダイムは、単純なツリー検索とセマンティックスコアリングを組み合わせたものだ。
我々は、CoTアプローチが階層的な分類における問題を検出する方法を示す。
論文 参考訳(メタデータ) (2026-01-01T23:36:13Z) - Connecting the Dots: Training-Free Visual Grounding via Agentic Reasoning [63.109585527799005]
GroundingAgentは、タスク固有の微調整なしで動作するビジュアルグラウンドティングフレームワークである。
広く使用されているベンチマークでは、平均ゼロショットグラウンドの精度は65.1%である。
また、強い解釈可能性を提供し、各推論ステップを透過的に照らす。
論文 参考訳(メタデータ) (2025-11-24T03:11:08Z) - Lookahead Routing for Large Language Models [24.082620717301477]
Lookaheadは、潜在的なモデル出力を"予測"し、これらの予測を使ってモデル選択をガイドするルーティングフレームワークである。
7つの公開ベンチマークに対する実証的な評価は、Lookaheadが既存のルーティングベースラインを一貫して上回っていることを示している。
論文 参考訳(メタデータ) (2025-10-22T12:00:21Z) - LLM-guided Hierarchical Retrieval [54.73080745446999]
LATTICEは階層的な検索フレームワークであり、LLMは対数探索の複雑さで大きなコーパスを推論し、ナビゲートすることができる。
LLM誘導探索における中心的な課題は、モデルの関連性判断がノイズが多く、文脈に依存し、階層性に気付かないことである。
我々のフレームワークは、推論集約型BRIGHTベンチマークで最先端のゼロショット性能を実現する。
論文 参考訳(メタデータ) (2025-10-15T07:05:17Z) - Heterogeneous LLM Methods for Ontology Learning (Few-Shot Prompting, Ensemble Typing, and Attention-Based Taxonomies) [46.54026795022501]
LLMs4OL 2025チャレンジのタスクA,B,Cに対処する包括的システムを提案する。
提案手法は、検索強化プロンプト、ゼロショット分類、アテンションに基づくグラフモデリングを組み合わせたものである。
これらのモジュラーでタスク固有のソリューションによって、公式のリーダーボードで上位の成果を得られるようになりました。
論文 参考訳(メタデータ) (2025-08-26T20:50:16Z) - CompassVerifier: A Unified and Robust Verifier for LLMs Evaluation and Outcome Reward [50.97588334916863]
評価と結果報酬のための正確で堅牢な軽量検証モデルであるCompassVerifierを開発した。
数学、知識、多種多様な推論タスクにまたがる多分野の能力を示し、様々な答えの型を処理する能力を示す。
我々は,複数のデータソースから収集したモデル出力からなるVerifierBenchベンチマークを導入し,メタエラーパターンを手動で解析してCompassVerifierを強化する。
論文 参考訳(メタデータ) (2025-08-05T17:55:24Z) - DeepSieve: Information Sieving via LLM-as-a-Knowledge-Router [57.28685457991806]
DeepSieveはエージェントRAGフレームワークで、LLM-as-a-knowledge-routerを介して情報を収集する。
我々の設計はモジュール性、透明性、適応性を重視しており、エージェントシステム設計の最近の進歩を活用している。
論文 参考訳(メタデータ) (2025-07-29T17:55:23Z) - A Semi-supervised Scalable Unified Framework for E-commerce Query Classification [13.695419069287482]
電子商取引クエリは通常短く、コンテキストがないため、ラベル間の情報は使用できない。
既存の産業用クエリ分類手法の多くは、ユーザの後クリック動作に依存してトレーニングサンプルを構築しており、マシューの悪循環に繋がる。
クエリ分類タスクを統一する複数の拡張モジュールを含むSSUF(Semi-supervised Scalable Unified Framework)を提案する。
論文 参考訳(メタデータ) (2025-06-26T06:52:33Z) - MMSearch-R1: Incentivizing LMMs to Search [49.889749277236376]
MMSearch-R1は,実世界のインターネット環境において,オンデマンドでマルチターン検索が可能な,初のエンドツーエンド強化学習フレームワークである。
本フレームワークは画像検索とテキスト検索の両方を統合し,検索ペナルティによる結果に基づく報酬によって,モデルがいつ,どのように呼び出すかの判断を可能にする。
論文 参考訳(メタデータ) (2025-06-25T17:59:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。