Fugu-MT 論文翻訳(概要): Probe-then-Plan: Environment-Aware Planning for Industrial E-commerce Search

論文の概要: Probe-then-Plan: Environment-Aware Planning for Industrial E-commerce Search

arxiv url: http://arxiv.org/abs/2603.15262v1
Date: Mon, 16 Mar 2026 13:28:01 GMT
ステータス: 翻訳完了
システム内更新日: 2026-03-17 18:28:58.317619
Title: Probe-then-Plan: Environment-Aware Planning for Industrial E-commerce Search
Title（参考訳）: Probe-then-Plan:産業用Eコマース検索のための環境意識プランニング
Authors: Mengxiang Chen, Zhouwei Zhai, Jin Li,
Abstract要約: 環境認識探索計画(EASP)は,環境現実を基盤とした動的推論プロセスとして探索計画を再編成する。 EASPはJD.comのAI-Searchシステムにうまくデプロイされている。
参考スコア（独自算出の注目度）: 2.977227542784575
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Modern e-commerce search is evolving to resolve complex user intents. While Large Language Models (LLMs) offer strong reasoning, existing LLM-based paradigms face a fundamental blindness-latency dilemma: query rewriting is agnostic to retrieval capabilities and real-time inventory, yielding invalid plans; conversely, deep search agents rely on iterative tool calls and reflection, incurring seconds of latency incompatible with industrial sub-second budgets. To resolve this conflict, we propose Environment-Aware Search Planning (EASP), reformulating search planning as a dynamic reasoning process grounded in environmental reality. EASP introduces a Probe-then-Plan mechanism: a lightweight Retrieval Probe exposes the retrieval snapshot, enabling the Planner to diagnose execution gaps and generate grounded search plans. The methodology comprises three stages: (1) Offline Data Synthesis: A Teacher Agent synthesizes diverse, execution-validated plans by diagnosing the probed environment. (2) Planner Training and Alignment: The Planner is initialized via Supervised Fine-Tuning (SFT) to internalize diagnostic capabilities, then aligned with business outcomes (conversion rate) via Reinforcement Learning (RL). (3) Adaptive Online Serving: A complexity-aware routing mechanism selectively activates planning for complex queries, ensuring optimal resource allocation. Extensive offline evaluations and online A/B testing on JD.com demonstrate that EASP significantly improves relevant recall and achieves substantial lifts in UCVR and GMV. EASP has been successfully deployed in JD.com's AI-Search system.
Abstract（参考訳）: 現代のeコマース検索は、複雑なユーザの意図を解決するために進化している。大きな言語モデル(LLM)は強力な推論を提供するが、既存のLCMベースのパラダイムは基本的な盲点-遅延ジレンマに直面している。クエリ書き換えは検索機能やリアルタイムインベントリに非依存であり、無効な計画を生成する。この対立を解決するために,環境現実に根ざした動的推論プロセスとして探索計画を変更する環境意識探索計画(EASP)を提案する。 EASPはProbe-then-Planメカニズムを導入した。軽量のRetrieval Probeは、検索スナップショットを公開することで、Plannerが実行ギャップを診断し、接地された検索プランを生成することができる。 1)オフラインデータ合成:教師エージェントは,調査対象の環境を診断することにより,多種多様な実行検証プランを合成する。 2) プランナー訓練・調整: 診断能力を内部化し、強化学習(RL:Reinforcement Learning)を通じたビジネス成果(転換率)と整合させるため、SFT(Supervised Fine-Tuning)を介して初期化される。 (3)Adaptive Online Serving: 複雑なクエリのプランニングを選択的に活性化し、最適なリソース割り当てを確保する。 JD.comの大規模なオフライン評価とオンラインA/Bテストは、EASPが関連するリコールを大幅に改善し、UCVRとGMVで大幅に上昇することを示した。 EASPはJD.comのAI-Searchシステムにうまくデプロイされている。

関連論文リスト

APEX-Searcher: Augmenting LLMs' Search Capabilities through Agentic Planning and Execution [10.643859464982071]
APEX-Searcherは、大規模言語モデル(LLM)検索能力を増強する新しいエージェントプランニングおよび実行フレームワークである。戦略計画の最適化のために、まずRLを分解特異的な報酬として採用する。その後、高品質なマルチホップ軌道の教師付き微調整を適用し、ロバストな反復的なサブタスク実行能力を持つモデルに装備する。
論文参考訳（メタデータ） (2026-03-14T09:17:12Z)
OSCAR: Optimization-Steered Agentic Planning for Composed Image Retrieval [33.823055061609125]
我々は、合成画像検索のための最適化されたエージェント計画フレームワークOSCARを提案する。我々は,エージェントCIRを探索プロセスから基本軌道最適化問題に再構成した最初の人物である。オフラインフェーズでは、原子検索選択と合成を2段階混合整数プログラミング問題としてモデル化する。これらのトラジェクトリは黄金のライブラリに格納され、VLMプランナのオンラインステアリングのためのコンテキスト内デモとして機能する。
論文参考訳（メタデータ） (2026-02-09T12:44:56Z)
When should I search more: Adaptive Complex Query Optimization with Reinforcement Learning [26.489185170468062]
適応複雑クエリ最適化(ACQO)と呼ばれる新しいRLフレームワークを提案する。我々のフレームワークは、いつ、どのように検索プロセスを拡張するかを適応的に決定するように設計されている。 ACQOは3つの複雑なクエリベンチマークで最先端のパフォーマンスを達成し、確立されたベースラインを大幅に上回っている。
論文参考訳（メタデータ） (2026-01-29T03:16:53Z)
Let the Barbarians In: How AI Can Accelerate Systems Performance Research [80.43506848683633]
我々は、この繰り返しサイクルを、AI駆動システム研究の生成、評価、洗練のサイクルと呼ぶ。我々はADRSが生成するソリューションが人間の最先端の設計に適合し、さらに優れることを示した。
論文参考訳（メタデータ） (2025-12-16T18:51:23Z)
DecoupleSearch: Decouple Planning and Search via Hierarchical Reward Modeling [56.45844907505722]
二重値モデルを用いて計画と探索プロセスを分離するフレームワークであるDecoupleSearchを提案する。提案手法は,各ノードが計画と探索のステップを表す推論木を構築する。推論中、階層的ビームサーチは、計画と探索候補を二重値モデルで反復的に洗練する。
論文参考訳（メタデータ） (2025-09-07T13:45:09Z)
Efficient Agent: Optimizing Planning Capability for Multimodal Retrieval Augmented Generation [17.115587821286223]
マルチモーダル大規模言語モデル(MLLM)のリアルタイムシナリオにおける時間的制限に対処する,有望なソリューションとして,mRAG(Multimodal Retrieval-Augmented Generation)が登場した。本稿では、コンテキスト推論に基づくマルチモーダルツールを動的にオーケストレーションするmRAGプランナと、ツール認識実行シーケンシングを用いたタスク実行器の2つの重要なイノベーションを特徴とするエージェントフレームワークであるE-Agentを提案する。
論文参考訳（メタデータ） (2025-08-12T10:17:12Z)
HiRA: A Hierarchical Reasoning Framework for Decoupled Planning and Execution in Deep Search [85.12447821237045]
HiRAは、戦略的な計画と専門的な実行を分離する階層的なフレームワークである。提案手法では,複雑な探索タスクを集中サブタスクに分解し,各サブタスクを外部ツールと推論機能を備えたドメイン固有エージェントに割り当てる。 4つの複雑なクロスモーダルなディープ・サーチ・ベンチマークの実験により、HiRAは最先端のRAGとエージェント・ベース・システムを大きく上回っていることが示された。
論文参考訳（メタデータ） (2025-07-03T14:18:08Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。