論文の概要: LLMs as Orchestrators: Constraint-Compliant Multi-Agent Optimization for Recommendation Systems
- arxiv url: http://arxiv.org/abs/2601.19121v3
- Date: Tue, 03 Feb 2026 01:10:35 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-04 16:18:58.790299
- Title: LLMs as Orchestrators: Constraint-Compliant Multi-Agent Optimization for Recommendation Systems
- Title(参考訳): オーケストレータとしてのLLM:レコメンデーションシステムのための制約対応マルチエージェント最適化
- Authors: Guilin Zhang, Kai Zhao, Jeffrey Friedman, Xu Chu,
- Abstract要約: 制約付き多目的eコマースレコメンデーションのためのLLM協調型デュアルエージェントフレームワークであるDualAgent-Recを提案する。
Amazon Reviews 2023データセットの実験では、DualAgent-Recが100%制約満足度を達成した。
これらの結果から,LSMはデプロイおよび制約に準拠したレコメンデーションシステムにおいて,効果的なオーケストレーションエージェントとして機能することが示唆された。
- 参考スコア(独自算出の注目度): 8.70920344844399
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Recommendation systems must optimize multiple objectives while satisfying hard business constraints such as fairness and coverage. For example, an e-commerce platform may require every recommendation list to include items from multiple sellers and at least one newly listed product; violating such constraints--even once--is unacceptable in production. Prior work on multi-objective recommendation and recent LLM-based recommender agents largely treat constraints as soft penalties or focus on item scoring and interaction, leading to frequent violations in real-world deployments. How to leverage LLMs for coordinating constrained optimization in recommendation systems remains underexplored. We propose DualAgent-Rec, an LLM-coordinated dual-agent framework for constrained multi-objective e-commerce recommendation. The framework separates optimization into an Exploitation Agent that prioritizes accuracy under hard constraints and an Exploration Agent that promotes diversity through unconstrained Pareto search. An LLM-based coordinator adaptively allocates resources between agents based on optimization progress and constraint satisfaction, while an adaptive epsilon-relaxation mechanism guarantees feasibility of final solutions. Experiments on the Amazon Reviews 2023 dataset demonstrate that DualAgent-Rec achieves 100% constraint satisfaction and improves Pareto hypervolume by 4-6% over strong baselines, while maintaining competitive accuracy-diversity trade-offs. These results indicate that LLMs can act as effective orchestration agents for deployable and constraint-compliant recommendation systems.
- Abstract(参考訳): 勧告システムは、公正さやカバレッジといった厳しいビジネス制約を満たしながら、複数の目的を最適化する必要があります。
例えば、eコマースプラットフォームは、すべてのレコメンデーションリストに複数の売り手からのアイテムと、少なくとも1つの新規に登録された製品を含む必要がある。
以前は、多目的レコメンデーションや、最近のLLMベースのレコメンデーターエージェントは、制約をソフトペナルティとして扱うか、アイテムのスコアリングとインタラクションに重点を置いており、現実のデプロイメントにおいて頻繁に違反する。
LLMをレコメンデーションシステムにおける制約付き最適化のコーディネートに利用する方法はまだ未検討である。
制約付き多目的eコマースレコメンデーションのためのLLM協調型デュアルエージェントフレームワークであるDualAgent-Recを提案する。
このフレームワークは、最適化をハード制約下で精度を優先するエクスプロイテーションエージェントと、制約のないパレートサーチによって多様性を促進する探索エージェントに分離する。
LLMベースのコーディネータは、最適化の進捗と制約満足度に基づいてエージェント間のリソースを適応的に割り当て、適応的エプシロン緩和機構は最終解の実現性を保証する。
Amazon Reviews 2023データセットの実験では、DualAgent-Recが100%制約満足度を達成し、強力なベースラインよりもパレートハイパーボリュームを4-6%改善し、競争力のある精度と多様性のトレードオフを維持していることが示された。
これらの結果から,LSMはデプロイおよび制約に準拠したレコメンデーションシステムにおいて,効果的なオーケストレーションエージェントとして機能することが示唆された。
関連論文リスト
- Conformal Constrained Policy Optimization for Cost-Effective LLM Agents [27.37909142846675]
大規模言語モデル(LLM)は最近、AI問題の解決に向けて大きな進歩を遂げた。
本稿では,複数のLLMモデルとコスト/精度のトレードオフをエージェント方式で組み合わせた新しい戦略を提案する。
当社のアプローチは,信頼性を維持しつつ,よりコスト効率のよいLCMエージェントをデプロイするための,原則的かつ実用的なフレームワークを提供する。
論文 参考訳(メタデータ) (2025-11-14T19:39:28Z) - LLM4CMO: Large Language Model-aided Algorithm Design for Constrained Multiobjective Optimization [54.35609820607923]
大規模言語モデル(LLM)は、アルゴリズム設計を支援する新しい機会を提供する。
LLM4CMOは,2つの人口構成をもつ2段階のフレームワークをベースとした新しいCMOEAである。
LLMは複雑な進化最適化アルゴリズムの開発において効率的な共同設計者として機能する。
論文 参考訳(メタデータ) (2025-08-16T02:00:57Z) - Heterogeneous Group-Based Reinforcement Learning for LLM-based Multi-Agent Systems [25.882461853973897]
本稿では、相対報酬の利点を推定して政策更新を導くマルチエージェント不均一グループ政策最適化(MHGPO)を提案する。
MHGPOは、批判的ネットワークの必要性を排除し、安定性を向上し、計算オーバーヘッドを減らす。
また,効率性と有効性を両立させる3つのグループロールアウトサンプリング戦略も導入する。
論文 参考訳(メタデータ) (2025-06-03T10:17:19Z) - Rethinking LLM-Based Recommendations: A Personalized Query-Driven Parallel Integration [22.650609670923732]
本稿では,大規模言語モデルを候補選択から切り離す並列レコメンデーションフレームワークを提案する。
我々のフレームワークはLLMとレコメンデーションモデルを並列に結合し、各コンポーネントが独立してその強みを活用できるようにする。
論文 参考訳(メタデータ) (2025-04-16T09:17:45Z) - Collab: Controlled Decoding using Mixture of Agents for LLM Alignment [90.6117569025754]
人間のフィードバックからの強化学習は、大規模言語モデルを整合させる効果的な手法として現れてきた。
制御された復号化は、再訓練せずに推論時にモデルを整列するメカニズムを提供する。
本稿では,既存の既成のLCMポリシを活用するエージェントベースのデコーディング戦略の混合を提案する。
論文 参考訳(メタデータ) (2025-03-27T17:34:25Z) - Dynamic Optimizations of LLM Ensembles with Two-Stage Reinforcement Learning Agents [31.341487297459995]
本稿では,LLMをルートおよびアンサンブルする2段階のRLエージェントフレームワークであるRL-Focalを紹介する。
焦点多様性により、報酬意識と政策適応型アンサンブル選択と推論融合を効果的に促進することにより、タスク間のパフォーマンスを向上させる。
論文 参考訳(メタデータ) (2025-02-06T20:44:26Z) - LLM4MSR: An LLM-Enhanced Paradigm for Multi-Scenario Recommendation [52.55639178180821]
マルチシナリオレコメンデーション(MSR)の研究は注目されており、すべてのシナリオのデータを使用してレコメンデーションのパフォーマンスを同時に改善している。
既存の手法では、不十分なシナリオ知識を統合し、パーソナライズされたクロスシナリオの嗜好を無視する傾向があり、それによってサブ最適パフォーマンスがもたらされる。
本稿では,これらのギャップを埋めるために,大規模言語モデル (LLM) 拡張パラダイム LLM4MSR を提案する。
論文 参考訳(メタデータ) (2024-06-18T11:59:36Z) - Towards Efficient LLM Grounding for Embodied Multi-Agent Collaboration [68.29746557968107]
本稿では,多エージェント協調のための新しいフレームワークを提案する。これは,効率的な自己調整のための強化アドバンテージフィードバック(Reinforced Advantage feedback, ReAd)を導入する。
Over-AIと難解なRoCoBenchの実験は、ReAdが成功率のベースラインを超え、エージェントの相互作用ステップを著しく減少させることを示している。
論文 参考訳(メタデータ) (2024-05-23T08:33:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。