論文の概要: Sample-Rank: Weak Multi-Objective Recommendations Using Rejection
Sampling
- arxiv url: http://arxiv.org/abs/2008.10277v1
- Date: Mon, 24 Aug 2020 09:17:18 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-25 09:17:28.816653
- Title: Sample-Rank: Weak Multi-Objective Recommendations Using Rejection
Sampling
- Title(参考訳): サンプルランク:拒絶サンプリングを用いた弱多目的推薦
- Authors: Abhay Shukla, Jairaj Sathyanarayana, Dipyaman Banerjee
- Abstract要約: 本稿では,マルチゴールサンプリングとユーザ関連度(Sample-Rank)のランク付けによるマーケットプレースの多目的目標への推薦手法を提案する。
提案手法の新規性は,望まれるマルチゴール分布からサンプリングするMOレコメンデーション問題を低減し,プロダクションフレンドリーな学習-ランクモデルを構築することである。
- 参考スコア(独自算出の注目度): 0.5156484100374059
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Online food ordering marketplaces are multi-stakeholder systems where
recommendations impact the experience and growth of each participant in the
system. A recommender system in this setting has to encapsulate the objectives
and constraints of different stakeholders in order to find utility of an item
for recommendation. Constrained-optimization based approaches to this problem
typically involve complex formulations and have high computational complexity
in production settings involving millions of entities. Simplifications and
relaxation techniques (for example, scalarization) help but introduce
sub-optimality and can be time-consuming due to the amount of tuning needed. In
this paper, we introduce a method involving multi-goal sampling followed by
ranking for user-relevance (Sample-Rank), to nudge recommendations towards
multi-objective (MO) goals of the marketplace. The proposed method's novelty is
that it reduces the MO recommendation problem to sampling from a desired
multi-goal distribution then using it to build a production-friendly
learning-to-rank (LTR) model. In offline experiments we show that we are able
to bias recommendations towards MO criteria with acceptable trade-offs in
metrics like AUC and NDCG. We also show results from a large-scale online A/B
experiment where this approach gave a statistically significant lift of 2.64%
in average revenue per order (RPO) (objective #1) with no drop in conversion
rate (CR) (objective #2) while holding the average last-mile traversed flat
(objective #3), vs. the baseline ranking method. This method also significantly
reduces time to model development and deployment in MO settings and allows for
trivial extensions to more objectives and other types of LTR models.
- Abstract(参考訳): オンライン食品注文マーケットプレイスは、システム内の各参加者の経験と成長に影響を及ぼすマルチステークホルダーシステムである。
この設定のレコメンダシステムは、推奨項目の効用を見つけるために、異なる利害関係者の目的と制約をカプセル化しなければならない。
この問題に対する制約最適化に基づくアプローチは、典型的には複雑な定式化を伴い、数百万のエンティティを含む生産環境において高い計算複雑性を有する。
単純化と緩和技術(例えば、スカラー化)は、準最適を導入するのに役立ち、必要なチューニング量のために時間がかかる。
本稿では,マルチゴールサンプリングとユーザ関連ランキング(Sample-Rank)を併用して,マーケットプレースのマルチオブジェクト(MO)目標に対する推薦を行う手法を提案する。
提案手法の新規性は、望まれるマルチゴール分布からサンプリングするMOレコメンデーション問題を低減し、プロダクションフレンドリーなラーニング・ツー・ランク(LTR)モデルを構築することである。
オフライン実験では,auc や ndcg などの指標で許容できるトレードオフを用いて,mo 基準に対するレコメンデーションをバイアスできることを示した。
また,大規模なオンラインa/b実験の結果から,この手法は,平均ラストマイルトラバースフラット(目的#3)とベースラインランキング法を比較検討しながら,コンバージョン率(cr)の低下(目的#2)を伴わずに,平均売上(rpo) (目的#1) で2.64%という統計的に有意な上昇を示した。
この方法はMO設定で開発とデプロイをモデル化する時間を大幅に短縮し、より多くの目的や他の種類のLTRモデルへの自明な拡張を可能にします。
関連論文リスト
- Adaptive Neural Ranking Framework: Toward Maximized Business Goal for
Cascade Ranking Systems [33.46891569350896]
カスケードランキングは、オンライン広告とレコメンデーションシステムにおける大規模なトップk選択問題に広く使われている。
それまでの学習からランクへの取り組みは、モデルに完全な順序やトップクオーダを学習させることに重点を置いていた。
我々はこの手法をアダプティブ・ニューラルランキング・フレームワーク (Adaptive Neural Ranking Framework, ARF) と命名する。
論文 参考訳(メタデータ) (2023-10-16T14:43:02Z) - Maximize to Explore: One Objective Function Fusing Estimation, Planning,
and Exploration [87.53543137162488]
我々はtextttMEX というオンライン強化学習(オンラインRL)フレームワークを提案する。
textttMEXは、自動的に探索エクスプロイトのバランスをとりながら、見積もりと計画コンポーネントを統合する。
様々な MuJoCo 環境では,ベースラインを安定的なマージンで上回り,十分な報酬を得られる。
論文 参考訳(メタデータ) (2023-05-29T17:25:26Z) - CAViaR: Context Aware Video Recommendations [0.0]
本稿では,低多様性が個々の項目に対するユーザのエンゲージメントに与える影響をモデル化し,多様性を導入する手法を提案する。
提案手法は,既存の大規模レコメンデータシステムに簡単にプラグインできるように設計されている。
論文 参考訳(メタデータ) (2023-04-17T16:56:23Z) - Sample-Efficient Personalization: Modeling User Parameters as Low Rank
Plus Sparse Components [30.32486162748558]
個人ユーザ/ドメイン/エンタプライズに対する機械学習(ML)予測のパーソナライズは,実践的なレコメンデーションシステムにおいて重要である。
ネットワーク重みを低ランクおよびスパース成分の和としてモデル化するメタラーニング方式を提案する。
AMHT-LRSは、ほぼ最適なサンプル複雑さで効率よく問題を解く。
論文 参考訳(メタデータ) (2022-10-07T12:50:34Z) - The Minority Matters: A Diversity-Promoting Collaborative Metric
Learning Algorithm [154.47590401735323]
CML(Collaborative Metric Learning)は、リコメンデーションシステムにおいて人気のある手法として最近登場した。
本稿では,ユーザが複数のカテゴリの関心を持つ,困難なシナリオに焦点をあてる。
textitDiversity-Promoting Collaborative Metric Learning (DPCML) と呼ばれる新しい手法を提案する。
論文 参考訳(メタデータ) (2022-09-30T08:02:18Z) - Multi-Label Learning to Rank through Multi-Objective Optimization [9.099663022952496]
近年,情報検索システムではランク付け技法の学習が至るところで行われている。
あいまいさを解決するためには、多くの関連基準を用いてモデルを訓練することが望ましい。
本稿では,ラベルからの情報を様々な方法で組み合わせて,目標間のトレードオフを特徴付ける,汎用的な枠組みを提案する。
論文 参考訳(メタデータ) (2022-07-07T03:02:11Z) - Low-variance estimation in the Plackett-Luce model via quasi-Monte Carlo
sampling [58.14878401145309]
PLモデルにおいて,より標本効率の高い予測値を生成するための新しい手法を開発した。
Amazon MusicのリアルなレコメンデーションデータとYahooの学習からランクへの挑戦を理論的にも実証的にも使用しています。
論文 参考訳(メタデータ) (2022-05-12T11:15:47Z) - Choosing the Best of Both Worlds: Diverse and Novel Recommendations
through Multi-Objective Reinforcement Learning [68.45370492516531]
本稿では,Recommender Systems (RS) 設定のための拡張多目的強化学習(SMORL)を紹介する。
SMORLエージェントは、標準レコメンデーションモデルを拡張し、RLレイヤーを追加し、3つの主要な目的(正確性、多様性、新しいレコメンデーション)を同時に満たすように強制する。
実世界の2つのデータセットに対する実験結果から,集約的多様性の顕著な増加,精度の適度な向上,レコメンデーションの反復性の低下,および相補的目的としての多様性と新規性の強化の重要性が示された。
論文 参考訳(メタデータ) (2021-10-28T13:22:45Z) - Exploration in two-stage recommender systems [79.50534282841618]
2段階のレコメンデータシステムは、スケーラビリティと保守性のために業界で広く採用されている。
このセットアップの鍵となる課題は、各ステージの最適性能が最適なグローバルパフォーマンスを暗示していないことである。
そこで本研究では,ランクとノミネーター間の探索戦略を同期させる手法を提案する。
論文 参考訳(メタデータ) (2020-09-01T16:52:51Z) - Multi-Scale Positive Sample Refinement for Few-Shot Object Detection [61.60255654558682]
Few-shot Object Detection (FSOD) は、ディテクターがトレーニングインスタンスをほとんど持たない未確認のクラスに適応するのに役立つ。
FSODにおけるオブジェクトスケールを拡張化するためのMPSR(Multi-scale Positive Sample Refinement)アプローチを提案する。
MPSRは、オブジェクトピラミッドとして多スケールの正のサンプルを生成し、様々なスケールで予測を洗練させる。
論文 参考訳(メタデータ) (2020-07-18T09:48:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。