論文の概要: Enhancing Personalized Ranking With Differentiable Group AUC
Optimization
- arxiv url: http://arxiv.org/abs/2304.09176v1
- Date: Mon, 17 Apr 2023 09:39:40 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-20 16:33:03.410291
- Title: Enhancing Personalized Ranking With Differentiable Group AUC
Optimization
- Title(参考訳): グループAUC最適化によるパーソナライズランキングの強化
- Authors: Xiao Sun, Bo Zhang, Chenrui Zhang, Han Ren, Mingchen Cai
- Abstract要約: PDAOM損失(PDAOM loss)は、最大値違反を有するパーソナライズ可能なAUC最適化手法である。
提案したPDAOM損失は、オフライン評価におけるAUCとGAUCのメトリクスを改善するだけでなく、トレーニング対象の複雑さを低減する。
Meituanのフィードレコメンデーションアプリケーション「Guess What You Like」におけるPDAOM損失のオンライン評価では、クリック数が1.40%増加し、注文数が0.65%増加した。
- 参考スコア(独自算出の注目度): 10.192514219354651
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: AUC is a common metric for evaluating the performance of a classifier.
However, most classifiers are trained with cross entropy, and it does not
optimize the AUC metric directly, which leaves a gap between the training and
evaluation stage. In this paper, we propose the PDAOM loss, a Personalized and
Differentiable AUC Optimization method with Maximum violation, which can be
directly applied when training a binary classifier and optimized with
gradient-based methods. Specifically, we construct the pairwise exponential
loss with difficult pair of positive and negative samples within sub-batches
grouped by user ID, aiming to guide the classifier to pay attention to the
relation between hard-distinguished pairs of opposite samples from the
perspective of independent users. Compared to the origin form of pairwise
exponential loss, the proposed PDAOM loss not only improves the AUC and GAUC
metrics in the offline evaluation, but also reduces the computation complexity
of the training objective. Furthermore, online evaluation of the PDAOM loss on
the 'Guess What You Like' feed recommendation application in Meituan manifests
1.40% increase in click count and 0.65% increase in order count compared to the
baseline model, which is a significant improvement in this well-developed
online life service recommendation system.
- Abstract(参考訳): AUCは分類器の性能を評価するための一般的な指標である。
しかし、ほとんどの分類器はクロスエントロピーで訓練されており、AUCメトリックを直接最適化していないため、トレーニングと評価の段階の間にギャップが残っている。
本稿では,二進分類器の訓練時に直接適用可能であり,勾配に基づく手法で最適化した,最大違反の個人化可能なauc最適化手法であるpdaom lossを提案する。
具体的には,ユーザidでグループ化されたサブバッチ内の正と負のサンプルのペアの難解なペアによる指数関数的損失を構築し,独立ユーザの観点から,分類器が反対のサンプルのハード・ディストリクトされたペアの関係に注意を払うように指導する。
対指数損失の原型と比較すると、提案したPDAOM損失は、オフライン評価におけるAUCとGAUCの指標を改善するだけでなく、トレーニング対象の計算複雑性を低減する。
さらに,Meituanのフィードレコメンデーションアプリケーション「Guess What You Like」におけるPDAOM損失のオンライン評価では,ベースラインモデルと比較してクリック数1.40%増加とオーダー数0.65%増加を示しており,この高度に発達したオンラインライフサービスレコメンデーションシステムにおいて大きな改善となっている。
関連論文リスト
- Ordinal Preference Optimization: Aligning Human Preferences via NDCG [28.745322441961438]
我々は、NDCGを異なる代理損失で近似することで、エンドツーエンドの選好最適化アルゴリズムを開発する。
OPOは、AlpacaEvalのような評価セットや一般的なベンチマークにおいて、既存のペアワイズおよびリストワイズアプローチよりも優れています。
論文 参考訳(メタデータ) (2024-10-06T03:49:28Z) - Bridging and Modeling Correlations in Pairwise Data for Direct Preference Optimization [75.1240295759264]
本稿では,BMC という名前のペアデータにおけるブリッジ・アンド・モデリングの効果的なフレームワークを提案する。
目的の修正によって、ペアの選好信号の一貫性と情報性が向上する。
DPOだけではこれらの相関をモデル化し、ニュアンス付き変動を捉えるには不十分である。
論文 参考訳(メタデータ) (2024-08-14T11:29:47Z) - Prior Constraints-based Reward Model Training for Aligning Large Language Models [58.33118716810208]
本稿では,この問題を解決するために,事前制約に基づくリワードモデル(PCRM)のトレーニング手法を提案する。
PCRMは、前回の制約、特に各比較ペアの出力間の長さ比とコサイン類似性を、最適化の規模を調節しスコアマージンを制御するための報酬モデルトレーニングに組み入れている。
実験結果から,PCRMは報酬スコアのスケーリングを効果的に抑制することによりアライメント性能を著しく向上することが示された。
論文 参考訳(メタデータ) (2024-04-01T07:49:11Z) - Lower-Left Partial AUC: An Effective and Efficient Optimization Metric
for Recommendation [52.45394284415614]
我々は,AUCのように計算効率が良く,Top-Kランキングの指標と強く相関する新しい最適化指標であるLLPAUCを提案する。
LLPAUCはローワーレフト角のROC曲線の下の部分領域のみを考慮し、最適化はトップKに焦点をあてる。
論文 参考訳(メタデータ) (2024-02-29T13:58:33Z) - Learning by Sorting: Self-supervised Learning with Group Ordering
Constraints [75.89238437237445]
本稿では,対照学習目標である群順序制約(GroCo)の新たなバリエーションを提案する。
正の対と負の対の距離をソートし、正の対が負の対よりも多くの距離を持つかに基づいてそれぞれの損失を計算するという考え方を利用しており、したがって正しく順序付けされていない。
各種自己教師付き学習ベンチマークの定式化について検討し、バニラのコントラスト学習と比較して結果が向上するだけでなく、k-NNの性能において、線形探索や性能向上において同等の手法と競合する性能を示すことを示す。
論文 参考訳(メタデータ) (2023-01-05T11:17:55Z) - Deep Negative Correlation Classification [82.45045814842595]
既存のディープアンサンブル手法は、多くの異なるモデルをナビゲートし、予測を集約する。
深部負相関分類(DNCC)を提案する。
DNCCは、個々の推定器が正確かつ負の相関を持つ深い分類アンサンブルを生成する。
論文 参考訳(メタデータ) (2022-12-14T07:35:20Z) - Adaptive Adversarial Logits Pairing [65.51670200266913]
逆行訓練ソリューションであるAdversarial Logits Pairing (ALP)は、脆弱なものに比べて、高い貢献度を少なくする傾向にある。
これらの観測により,適応型対数対数対数対数対数対数法 (AALP) を設計し,ALPのトレーニングプロセスとトレーニングターゲットを変更する。
AALPは適応的な機能最適化モジュールと Guided Dropout から構成されており、より少ない高コントリビューション機能を体系的に追求する。
論文 参考訳(メタデータ) (2020-05-25T03:12:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。