論文の概要: MBGR: Multi-Business Prediction for Generative Recommendation at Meituan
- arxiv url: http://arxiv.org/abs/2604.02684v1
- Date: Fri, 03 Apr 2026 03:26:36 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-06 17:20:24.300191
- Title: MBGR: Multi-Business Prediction for Generative Recommendation at Meituan
- Title(参考訳): MBGR:Meituanにおけるジェネレーティブレコメンデーションのマルチビジネス予測
- Authors: Changhao Li, Junwei Yin, Zhilin Zeng, Senjie Kou, Shuli Wang, Wenshuai Chen, Yinhua Zhu, Haitao Wang, Xingxing Wang,
- Abstract要約: マルチビジネスシナリオに適した最初のGRフレームワークであるMBGR(Multi-Business Generative Recommendation)を提案する。
まず、ドメイン認識トークン化によるセマンティックな整合性を維持するBusiness-Aware semantic ID (BID) モジュールを設計する。
次に、ビジネス固有の予測機能を提供するために、マルチビジネス予測(MBP)構造を導入する。
- 参考スコア(独自算出の注目度): 9.019241944784971
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Generative recommendation (GR) has recently emerged as a promising paradigm for industrial recommendations. GR leverages Semantic IDs (SIDs) to reduce the encoding-decoding space and employs the Next Token Prediction (NTP) framework to explore scaling laws. However, existing GR methods suffer from two critical issues: (1) a \textbf{seesaw phenomenon} in multi-business scenarios arises due to NTP's inability to capture complex cross-business behavioral patterns; and (2) a unified SID space causes \textbf{representation confusion} by failing to distinguish distinct semantic information across businesses. To address these issues, we propose Multi-Business Generative Recommendation (MBGR), the first GR framework tailored for multi-business scenarios. Our framework comprises three key components. First, we design a Business-aware semantic ID (BID) module that preserves semantic integrity via domain-aware tokenization. Then, we introduce a Multi-Business Prediction (MBP) structure to provide business-specific prediction capabilities. Furthermore, we develop a Label Dynamic Routing (LDR) module that transforms sparse multi-business labels into dense labels to further enhance the multi-business generation capability. Extensive offline and online experiments on Meituan's food delivery platform validate MBGR's effectiveness, and we have successfully deployed it in production.
- Abstract(参考訳): ジェネレーティブレコメンデーション(GR)は近年,産業レコメンデーションの有望なパラダイムとして浮上している。
GRはセマンティックID(SID)を活用してエンコーディング/デコーディングスペースを削減し、Next Token Prediction(NTP)フレームワークを使用してスケーリング法則を探索する。
しかし, 既存のGR法では, 複合ビジネスシナリオにおける \textbf{seesaw 現象は, NTP が複雑なビジネス間行動パターンをキャプチャできないために生じるものであり, 2) 統合されたSID空間は, ビジネス間で異なる意味情報を区別できないことにより, textbf{representation confusion} を引き起こす。
これらの問題に対処するため、我々は、マルチビジネスシナリオに適した最初のGRフレームワークであるMulti-Business Generative Recommendation (MBGR)を提案する。
私たちのフレームワークは3つのキーコンポーネントで構成されています。
まず、ドメイン認識トークン化によるセマンティックな整合性を維持するBusiness-Aware semantic ID (BID) モジュールを設計する。
次に、ビジネス固有の予測機能を提供するために、マルチビジネス予測(MBP)構造を導入する。
さらに,スパースなマルチビジネスラベルを高密度なラベルに変換することで,マルチビジネス生成能力をさらに向上するラベル動的ルーティング(LDR)モジュールを開発した。
Meituanのフードデリバリープラットフォームにおける大規模なオフラインおよびオンライン実験は、MBGRの有効性を検証し、本番環境でのデプロイに成功した。
関連論文リスト
- PLUME: Latent Reasoning Based Universal Multimodal Embedding [52.35354073629127]
ユニバーサルマルチモーダル埋め込み(UME)は、異種入力を単一のモデルで共有検索空間にマッピングする。
最近のアプローチでは、埋め込みを抽出する前に明確なチェーン・オブ・シント(CoT)論理を生成することにより、UMEを改善している。
PLUMEは,言語化されたCoTを連続的潜伏状態の短時間の自己回帰ロールアウトに置き換えることで,UMEを進化させる潜在的推論フレームワークである。
論文 参考訳(メタデータ) (2026-04-02T14:04:53Z) - Reasoning-Driven Multimodal LLM for Domain Generalization [72.00754603114187]
DomainBed-Reasoning データセットを用いた領域一般化における推論の役割について検討する。
MTCT(Multi-Task Cross-Training)とSARR(Self-Aligned Reasoning Regularization)の2つのコンポーネントからなるフレームワークであるRD-MLDGを提案する。
標準のDomainBedデータセットの実験は、RD-MLDGが補完的な最先端のパフォーマンスを達成することを示した。
論文 参考訳(メタデータ) (2026-02-27T08:10:06Z) - SIGMA: A Semantic-Grounded Instruction-Driven Generative Multi-Task Recommender at AliExpress [17.904783443841726]
本稿では,SIGMA(Semantic-Grounded Instruction-Driven Generative Multi-Task Recommender)を提案する。
まず、一般的な意味論において、意味的および協調的な関係をキャプチャする統合潜在空間を通して、アイテムの実体を基礎とする。
大規模マルチタスクSFTデータセットを構築し、SIGMAが命令追従によって様々なレコメンデーション要求を満たすようにします。
論文 参考訳(メタデータ) (2026-02-26T12:00:46Z) - Masked Diffusion Generative Recommendation [14.679550929790151]
ジェネレーティブレコメンデーション(GR)は、通常、連続アイテムの埋め込みをマルチレベルセマンティックID(SID)に量子化する。
MDGRはMasked Diffusion Generative Recommendationフレームワークで,コードブック,トレーニング,推論という3つの観点からGRパイプラインを再評価する。
論文 参考訳(メタデータ) (2026-01-27T11:39:02Z) - Multi-Aspect Cross-modal Quantization for Generative Recommendation [27.92632297542123]
生成レコメンデーション(MACRec)のための多視点クロスモーダル量子化を提案する。
まず、ID学習過程において、競合率を効果的に低減するクロスモーダル量子化を導入する。
また、暗黙のアライメントや明示的なアライメントを含むマルチアスペクトのクロスモーダルアライメントも組み込んでいます。
論文 参考訳(メタデータ) (2025-11-19T04:55:14Z) - Scaling Beyond Context: A Survey of Multimodal Retrieval-Augmented Generation for Document Understanding [61.36285696607487]
文書理解は、財務分析から科学的発見への応用に不可欠である。
現在のアプローチでは、OCRベースのパイプラインがLarge Language Models(LLM)やネイティブのMultimodal LLMs(MLLM)に制限されている。
Retrieval-Augmented Generation (RAG)は、外部データの基底モデルを支援するが、文書のマルチモーダルな性質は、テキスト、テーブル、チャート、レイアウトを組み合わせることで、より高度なパラダイムを必要とする。
論文 参考訳(メタデータ) (2025-10-17T02:33:16Z) - MMESGBench: Pioneering Multimodal Understanding and Complex Reasoning Benchmark for ESG Tasks [56.350173737493215]
環境・社会・ガバナンス(ESG)報告は、持続可能性の実践の評価、規制コンプライアンスの確保、財務透明性の促進に不可欠である。
MMESGBenchは、マルチモーダル理解と複雑な推論を、構造的に多種多様なマルチソースESG文書間で評価するための、最初のベンチマークデータセットである。
MMESGBenchは、45のESG文書から得られた933の検証済みQAペアで構成され、7つの異なるドキュメントタイプと3つの主要なESGソースカテゴリにまたがる。
論文 参考訳(メタデータ) (2025-07-25T03:58:07Z) - IDEA: Inverted Text with Cooperative Deformable Aggregation for Multi-modal Object Re-Identification [60.38841251693781]
本稿では,ロバストなマルチモーダルオブジェクトReIDを生成する新しいフレームワークを提案する。
我々のフレームワークは、多モーダル情報と逆テキストからのセマンティックガイダンスを統合するために、Modal PrefixesとInverseNetを使用している。
3つのマルチモーダルオブジェクトReIDベンチマーク実験により,提案手法の有効性が示された。
論文 参考訳(メタデータ) (2025-03-13T13:00:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。