論文の概要: OptAgent: Optimizing Query Rewriting for E-commerce via Multi-Agent Simulation
- arxiv url: http://arxiv.org/abs/2510.03771v1
- Date: Sat, 04 Oct 2025 10:41:09 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-07 16:52:59.244368
- Title: OptAgent: Optimizing Query Rewriting for E-commerce via Multi-Agent Simulation
- Title(参考訳): OptAgent:マルチエージェントシミュレーションによるEコマースのためのクエリ書き換え最適化
- Authors: Divij Handa, David Blincoe, Orson Adams, Yinlin Fu,
- Abstract要約: OptAgentは、マルチエージェントシミュレーションと遺伝的アルゴリズムを組み合わせて、eコマースクエリのクエリを検証、最適化する新しいフレームワークである。
我々は、OptAgentを5つのカテゴリで1000の現実世界のeコマースクエリのデータセットで評価する。
- 参考スコア(独自算出の注目度): 1.3722079106827219
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Deploying capable and user-aligned LLM-based systems necessitates reliable evaluation. While LLMs excel in verifiable tasks like coding and mathematics, where gold-standard solutions are available, adoption remains challenging for subjective tasks that lack a single correct answer. E-commerce Query Rewriting (QR) is one such problem where determining whether a rewritten query properly captures the user intent is extremely difficult to figure out algorithmically. In this work, we introduce OptAgent, a novel framework that combines multi-agent simulations with genetic algorithms to verify and optimize queries for QR. Instead of relying on a static reward model or a single LLM judge, our approach uses multiple LLM-based agents, each acting as a simulated shopping customer, as a dynamic reward signal. The average of these agent-derived scores serves as an effective fitness function for an evolutionary algorithm that iteratively refines the user's initial query. We evaluate OptAgent on a dataset of 1000 real-world e-commerce queries in five different categories, and we observe an average improvement of 21.98% over the original user query and 3.36% over a Best-of-N LLM rewriting baseline.
- Abstract(参考訳): 能力とユーザ対応のLCMベースのシステムは、信頼性の高い評価を必要とする。
LLMは、ゴールドスタンダードのソリューションが利用可能であるコーディングや数学のような検証可能なタスクに優れていますが、単一の正解を持たない主観的なタスクでは採用が難しいままです。
E-Commerce Query Rewriting (QR) は、リライトされたクエリがユーザの意図を適切に捉えているかどうかを判断するアルゴリズムの理解が極めて難しい問題である。
本稿では,マルチエージェントシミュレーションと遺伝的アルゴリズムを組み合わせた新しいフレームワークであるOpsAgentを紹介し,QRのクエリの検証と最適化を行う。
提案手法では,静的報酬モデルや単一 LLM の判断に代えて,複数の LLM ベースのエージェントを用いて,各エージェントが動的報酬信号としてシミュレートされたショッピングカスタマーとして機能する。
これらのエージェント由来スコアの平均は、ユーザの初期クエリを反復的に洗練する進化アルゴリズムの効果的な適合関数として機能する。
我々は、OptAgentを5つのカテゴリで1000のリアルタイムeコマースクエリのデータセットで評価し、元のユーザクエリよりも21.98%、Best-of-N LLM書き換えベースラインよりも3.36%の平均的な改善を観察した。
関連論文リスト
- Compliance Brain Assistant: Conversational Agentic AI for Assisting Compliance Tasks in Enterprise Environments [2.8724171056550256]
Compliance Brain Assistant (CBA) は、企業環境における人員の日々のコンプライアンスタスクの効率を高めるために設計された、対話型のエージェントAIアシスタントである。
応答品質とレイテンシのバランスを良くするために,FastTrackモードとFullAgenticモードをインテリジェントに選択できるユーザクエリルータを設計する。
論文 参考訳(メタデータ) (2025-07-23T07:51:10Z) - Collab: Controlled Decoding using Mixture of Agents for LLM Alignment [90.6117569025754]
人間のフィードバックからの強化学習は、大規模言語モデルを整合させる効果的な手法として現れてきた。
制御された復号化は、再訓練せずに推論時にモデルを整列するメカニズムを提供する。
本稿では,既存の既成のLCMポリシを活用するエージェントベースのデコーディング戦略の混合を提案する。
論文 参考訳(メタデータ) (2025-03-27T17:34:25Z) - MALT: Improving Reasoning with Multi-Agent LLM Training [67.76186488361685]
MALT(Multi-Agent LLM Training)は、推論プロセスを生成、検証、改善ステップに分割する、新しいポストトレーニング戦略である。
MATH、GSM8K、CSQAでは、MALTは、それぞれ15.66%、7.42%、9.40%の相対的な改善で同じベースラインLLMを上回っている。
論文 参考訳(メタデータ) (2024-12-02T19:30:36Z) - MAG-V: A Multi-Agent Framework for Synthetic Data Generation and Verification [5.666070277424383]
MAG-Vは、顧客のクエリを模倣する質問のデータセットを生成するフレームワークである。
我々の合成データは、実際の顧客クエリにおけるエージェントのパフォーマンスを向上させることができる。
論文 参考訳(メタデータ) (2024-11-28T19:36:11Z) - Adaptive-RAG: Learning to Adapt Retrieval-Augmented Large Language Models through Question Complexity [59.57065228857247]
Retrieval-augmented Large Language Models (LLMs) は、質問回答(QA)のようなタスクにおける応答精度を高めるための有望なアプローチとして登場した。
本稿では,クエリの複雑さに基づいて,LLMの最適戦略を動的に選択できる適応型QAフレームワークを提案する。
オープンドメインのQAデータセットを用いて、複数のクエリの複雑さを網羅し、QAシステムの全体的な効率性と精度を高めることを示す。
論文 参考訳(メタデータ) (2024-03-21T13:52:30Z) - Recommender AI Agent: Integrating Large Language Models for Interactive
Recommendations [53.76682562935373]
我々は,LLMを脳として,レコメンダモデルをツールとして使用する,textbfInteRecAgentという効率的なフレームワークを紹介した。
InteRecAgentは会話レコメンデーションシステムとして満足度を達成し、汎用LLMよりも優れる。
論文 参考訳(メタデータ) (2023-08-31T07:36:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。