論文の概要: Sample-Rank: Weak Multi-Objective Recommendations Using Rejection
Sampling
- arxiv url: http://arxiv.org/abs/2008.10277v1
- Date: Mon, 24 Aug 2020 09:17:18 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-25 09:17:28.816653
- Title: Sample-Rank: Weak Multi-Objective Recommendations Using Rejection
Sampling
- Title(参考訳): サンプルランク:拒絶サンプリングを用いた弱多目的推薦
- Authors: Abhay Shukla, Jairaj Sathyanarayana, Dipyaman Banerjee
- Abstract要約: 本稿では,マルチゴールサンプリングとユーザ関連度(Sample-Rank)のランク付けによるマーケットプレースの多目的目標への推薦手法を提案する。
提案手法の新規性は,望まれるマルチゴール分布からサンプリングするMOレコメンデーション問題を低減し,プロダクションフレンドリーな学習-ランクモデルを構築することである。
- 参考スコア(独自算出の注目度): 0.5156484100374059
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Online food ordering marketplaces are multi-stakeholder systems where
recommendations impact the experience and growth of each participant in the
system. A recommender system in this setting has to encapsulate the objectives
and constraints of different stakeholders in order to find utility of an item
for recommendation. Constrained-optimization based approaches to this problem
typically involve complex formulations and have high computational complexity
in production settings involving millions of entities. Simplifications and
relaxation techniques (for example, scalarization) help but introduce
sub-optimality and can be time-consuming due to the amount of tuning needed. In
this paper, we introduce a method involving multi-goal sampling followed by
ranking for user-relevance (Sample-Rank), to nudge recommendations towards
multi-objective (MO) goals of the marketplace. The proposed method's novelty is
that it reduces the MO recommendation problem to sampling from a desired
multi-goal distribution then using it to build a production-friendly
learning-to-rank (LTR) model. In offline experiments we show that we are able
to bias recommendations towards MO criteria with acceptable trade-offs in
metrics like AUC and NDCG. We also show results from a large-scale online A/B
experiment where this approach gave a statistically significant lift of 2.64%
in average revenue per order (RPO) (objective #1) with no drop in conversion
rate (CR) (objective #2) while holding the average last-mile traversed flat
(objective #3), vs. the baseline ranking method. This method also significantly
reduces time to model development and deployment in MO settings and allows for
trivial extensions to more objectives and other types of LTR models.
- Abstract(参考訳): オンライン食品注文マーケットプレイスは、システム内の各参加者の経験と成長に影響を及ぼすマルチステークホルダーシステムである。
この設定のレコメンダシステムは、推奨項目の効用を見つけるために、異なる利害関係者の目的と制約をカプセル化しなければならない。
この問題に対する制約最適化に基づくアプローチは、典型的には複雑な定式化を伴い、数百万のエンティティを含む生産環境において高い計算複雑性を有する。
単純化と緩和技術(例えば、スカラー化)は、準最適を導入するのに役立ち、必要なチューニング量のために時間がかかる。
本稿では,マルチゴールサンプリングとユーザ関連ランキング(Sample-Rank)を併用して,マーケットプレースのマルチオブジェクト(MO)目標に対する推薦を行う手法を提案する。
提案手法の新規性は、望まれるマルチゴール分布からサンプリングするMOレコメンデーション問題を低減し、プロダクションフレンドリーなラーニング・ツー・ランク(LTR)モデルを構築することである。
オフライン実験では,auc や ndcg などの指標で許容できるトレードオフを用いて,mo 基準に対するレコメンデーションをバイアスできることを示した。
また,大規模なオンラインa/b実験の結果から,この手法は,平均ラストマイルトラバースフラット(目的#3)とベースラインランキング法を比較検討しながら,コンバージョン率(cr)の低下(目的#2)を伴わずに,平均売上(rpo) (目的#1) で2.64%という統計的に有意な上昇を示した。
この方法はMO設定で開発とデプロイをモデル化する時間を大幅に短縮し、より多くの目的や他の種類のLTRモデルへの自明な拡張を可能にします。
関連論文リスト
- Large Language Model Empowered Embedding Generator for Sequential Recommendation [57.49045064294086]
大言語モデル(LLM)は、その人気に関係なく、項目間の意味的関係を理解する能力を持つ。
LLMEmbは、LCMを利用してアイテム埋め込みを作成し、シークエンシャル・レコメンダ・システムの性能を高める革新的な技術である。
論文 参考訳(メタデータ) (2024-09-30T03:59:06Z) - Improved Diversity-Promoting Collaborative Metric Learning for Recommendation [127.08043409083687]
CML(Collaborative Metric Learning)は、リコメンデーションシステムにおいて人気のある手法として最近登場した。
本稿では,ユーザが複数のカテゴリの関心を持つ,困難なシナリオに焦点をあてる。
textitDiversity-Promoting Collaborative Metric Learning (DPCML) と呼ばれる新しい手法を提案する。
論文 参考訳(メタデータ) (2024-09-02T07:44:48Z) - DLCRec: A Novel Approach for Managing Diversity in LLM-Based Recommender Systems [9.433227503973077]
LLMに基づくレコメンデーションにおいて,多様性のきめ細かい制御を可能にする新しいフレームワークを提案する。
従来の方法とは異なり、DLCRecはきめ細かいタスク分解戦略を採用し、推奨プロセスを3つのサブタスクに分割する。
本稿では,ノイズやアウト・オブ・ディストリビューションデータに対するモデルの堅牢性を高める2つのデータ拡張手法を提案する。
論文 参考訳(メタデータ) (2024-08-22T15:10:56Z) - DimeRec: A Unified Framework for Enhanced Sequential Recommendation via Generative Diffusion Models [39.49215596285211]
シークエンシャルレコメンデーション(SR:Sequential Recommendation)は、非定常的な歴史的相互作用に基づいてユーザの好みに合わせてレコメンデーションを調整することによって、レコメンデーションシステムにおいて重要な役割を担っている。
誘導抽出モジュール(GEM)と生成拡散凝集モジュール(DAM)を組み合わせたDimeRecという新しいフレームワークを提案する。
我々の数値実験により、DimeRecは3つの公開データセットで確立されたベースライン法よりも大幅に優れていることが示された。
論文 参考訳(メタデータ) (2024-08-22T06:42:09Z) - Regression-aware Inference with LLMs [52.764328080398805]
提案手法は,一般的な回帰と評価指標に準最適であることを示す。
本稿では,ベイズ最適解を推定し,サンプル応答からクローズド形式の評価指標を推定する代替推論手法を提案する。
論文 参考訳(メタデータ) (2024-03-07T03:24:34Z) - Adaptive Neural Ranking Framework: Toward Maximized Business Goal for
Cascade Ranking Systems [33.46891569350896]
カスケードランキングは、オンライン広告とレコメンデーションシステムにおける大規模なトップk選択問題に広く使われている。
それまでの学習からランクへの取り組みは、モデルに完全な順序やトップクオーダを学習させることに重点を置いていた。
我々はこの手法をアダプティブ・ニューラルランキング・フレームワーク (Adaptive Neural Ranking Framework, ARF) と命名する。
論文 参考訳(メタデータ) (2023-10-16T14:43:02Z) - Maximize to Explore: One Objective Function Fusing Estimation, Planning,
and Exploration [87.53543137162488]
我々はtextttMEX というオンライン強化学習(オンラインRL)フレームワークを提案する。
textttMEXは、自動的に探索エクスプロイトのバランスをとりながら、見積もりと計画コンポーネントを統合する。
様々な MuJoCo 環境では,ベースラインを安定的なマージンで上回り,十分な報酬を得られる。
論文 参考訳(メタデータ) (2023-05-29T17:25:26Z) - Choosing the Best of Both Worlds: Diverse and Novel Recommendations
through Multi-Objective Reinforcement Learning [68.45370492516531]
本稿では,Recommender Systems (RS) 設定のための拡張多目的強化学習(SMORL)を紹介する。
SMORLエージェントは、標準レコメンデーションモデルを拡張し、RLレイヤーを追加し、3つの主要な目的(正確性、多様性、新しいレコメンデーション)を同時に満たすように強制する。
実世界の2つのデータセットに対する実験結果から,集約的多様性の顕著な増加,精度の適度な向上,レコメンデーションの反復性の低下,および相補的目的としての多様性と新規性の強化の重要性が示された。
論文 参考訳(メタデータ) (2021-10-28T13:22:45Z) - Multi-Scale Positive Sample Refinement for Few-Shot Object Detection [61.60255654558682]
Few-shot Object Detection (FSOD) は、ディテクターがトレーニングインスタンスをほとんど持たない未確認のクラスに適応するのに役立つ。
FSODにおけるオブジェクトスケールを拡張化するためのMPSR(Multi-scale Positive Sample Refinement)アプローチを提案する。
MPSRは、オブジェクトピラミッドとして多スケールの正のサンプルを生成し、様々なスケールで予測を洗練させる。
論文 参考訳(メタデータ) (2020-07-18T09:48:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。