論文の概要: Learning Recommender Systems with Soft Target: A Decoupled Perspective
- arxiv url: http://arxiv.org/abs/2410.06536v1
- Date: Wed, 09 Oct 2024 04:20:15 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-11-10 13:33:12.123396
- Title: Learning Recommender Systems with Soft Target: A Decoupled Perspective
- Title(参考訳): ソフトターゲットによるレコメンダシステムの学習:非結合的な視点
- Authors: Hao Zhang, Mingyue Cheng, Qi Liu, Yucong Luo, Rui Li, Enhong Chen,
- Abstract要約: そこで本研究では,ソフトラベルを活用することで,目的を2つの側面として捉えるために,分離されたソフトラベル最適化フレームワークを提案する。
本稿では,ラベル伝搬アルゴリズムをモデル化したソフトラベル生成アルゴリズムを提案する。
- 参考スコア(独自算出の注目度): 49.83787742587449
- License:
- Abstract: Learning recommender systems with multi-class optimization objective is a prevalent setting in recommendation. However, as observed user feedback often accounts for a tiny fraction of the entire item pool, the standard Softmax loss tends to ignore the difference between potential positive feedback and truly negative feedback. To address this challenge, we propose a novel decoupled soft label optimization framework to consider the objectives as two aspects by leveraging soft labels, including target confidence and the latent interest distribution of non-target items. Futhermore, based on our carefully theoretical analysis, we design a decoupled loss function to flexibly adjust the importance of these two aspects. To maximize the performance of the proposed method, we additionally present a sensible soft-label generation algorithm that models a label propagation algorithm to explore users' latent interests in unobserved feedback via neighbors. We conduct extensive experiments on various recommendation system models and public datasets, the results demonstrate the effectiveness and generality of the proposed method.
- Abstract(参考訳): マルチクラス最適化の目的を持ったレコメンデータシステムの学習が推奨される。
しかしながら、観察されたユーザのフィードバックがアイテムプール全体のごく一部を占めることが多いため、標準的なSoftmaxの損失は、潜在的な肯定的なフィードバックと真に否定的なフィードバックの違いを無視する傾向があります。
この課題に対処するために,対象の信頼度や非対象項目の潜在利息分布などのソフトラベルを活用することにより,目的を2つの側面として捉えるための,分離されたソフトラベル最適化フレームワークを提案する。
さらに、我々の慎重に理論的解析に基づいて、これらの2つの側面の重要性を柔軟に調整する疎結合損失関数を設計する。
提案手法の性能を最大化するために,ラベル伝搬アルゴリズムをモデル化したソフトラベル生成アルゴリズムを提案する。
提案手法の有効性と汎用性を示すため,様々なレコメンデーションシステムモデルと公開データセットについて広範な実験を行った。
関連論文リスト
- Self-supervised Preference Optimization: Enhance Your Language Model with Preference Degree Awareness [27.43137305486112]
本稿では,自己監督的選好度損失とアライメント損失を組み合わせた自己監督的選好度損失を構成する,新しい自己監督的選好最適化(SPO)フレームワークを提案する。
その結果,SPOを既存の好み最適化手法とシームレスに統合し,最先端性能を実現することができた。
論文 参考訳(メタデータ) (2024-09-26T12:37:26Z) - Exploiting Preferences in Loss Functions for Sequential Recommendation via Weak Transitivity [4.7894654945375175]
最適化の目的の選択は、レコメンダシステムの設計において極めて重要である。
そこで本研究では,スコア間の相対的な順序として,異なる選好レベルを明示的に活用するために,本来の目的を拡張した新しい手法を提案する。
論文 参考訳(メタデータ) (2024-08-01T06:55:19Z) - Beyond Thumbs Up/Down: Untangling Challenges of Fine-Grained Feedback for Text-to-Image Generation [67.88747330066049]
きめ細かいフィードバックは、画像の品質と迅速な調整におけるニュアンスドの区別を捉えます。
粗いフィードバックに対する優位性を示すことは、自動ではないことを示す。
きめ細かいフィードバックを抽出し活用する上で重要な課題を特定します。
論文 参考訳(メタデータ) (2024-06-24T17:19:34Z) - Improving One-class Recommendation with Multi-tasking on Various
Preference Intensities [1.8416014644193064]
一流のレコメンデーションでは、ユーザの暗黙のフィードバックに基づいてレコメンデーションを行う必要があります。
暗黙的なフィードバックから各信号の様々な好み強度を考慮に入れたマルチタスクフレームワークを提案する。
提案手法は,3つの大規模実世界のベンチマークデータセットに対して,最先端の手法よりも大きなマージンで性能を向上する。
論文 参考訳(メタデータ) (2024-01-18T18:59:55Z) - When Measures are Unreliable: Imperceptible Adversarial Perturbations
toward Top-$k$ Multi-Label Learning [83.8758881342346]
新しい損失関数は、視覚的および測定的不受容性を両立できる敵の摂動を生成するために考案された。
大規模ベンチマークデータセットを用いた実験により,提案手法が最上位の$kのマルチラベルシステムを攻撃する際の優位性を実証した。
論文 参考訳(メタデータ) (2023-07-27T13:18:47Z) - Rethinking Missing Data: Aleatoric Uncertainty-Aware Recommendation [59.500347564280204]
本稿では, Aleatoric Uncertainty-aware Recommendation (AUR) フレームワークを提案する。
AURは、新しい不確実性推定器と通常のレコメンデータモデルで構成されている。
誤ラベルの可能性がペアの可能性を反映しているため、AURは不確実性に応じてレコメンデーションを行う。
論文 参考訳(メタデータ) (2022-09-22T04:32:51Z) - CausPref: Causal Preference Learning for Out-of-Distribution
Recommendation [36.22965012642248]
現在のレコメンデータシステムは、現実的なシナリオにおけるユーザやアイテムの配布シフトに対して、依然として脆弱である。
本稿では,推奨特化DAG学習者を因果選好に基づく推薦フレームワークCausPrefに組み込むことを提案する。
当社のアプローチは、アウト・オブ・ディストリビューション・セッティングのタイプにおいて、ベンチマークモデルを大幅に上回っている。
論文 参考訳(メタデータ) (2022-02-08T16:42:03Z) - Unbiased Pairwise Learning to Rank in Recommender Systems [4.058828240864671]
アルゴリズムをランク付けする偏見のない学習は、候補をアピールし、既に単一の分類ラベルを持つ多くのアプリケーションに適用されている。
本稿では,この課題に対処するための新しい非バイアス付きLTRアルゴリズムを提案する。
パブリックベンチマークデータセットと内部ライブトラフィックを用いた実験結果から,分類ラベルと連続ラベルのいずれにおいても提案手法の優れた結果が得られた。
論文 参考訳(メタデータ) (2021-11-25T06:04:59Z) - Choosing the Best of Both Worlds: Diverse and Novel Recommendations
through Multi-Objective Reinforcement Learning [68.45370492516531]
本稿では,Recommender Systems (RS) 設定のための拡張多目的強化学習(SMORL)を紹介する。
SMORLエージェントは、標準レコメンデーションモデルを拡張し、RLレイヤーを追加し、3つの主要な目的(正確性、多様性、新しいレコメンデーション)を同時に満たすように強制する。
実世界の2つのデータセットに対する実験結果から,集約的多様性の顕著な増加,精度の適度な向上,レコメンデーションの反復性の低下,および相補的目的としての多様性と新規性の強化の重要性が示された。
論文 参考訳(メタデータ) (2021-10-28T13:22:45Z) - Latent Unexpected Recommendations [89.2011481379093]
ユーザとアイテムの埋め込みの潜伏した空間における予測性をモデル化し、新しいレコメンデーションと歴史的購入の間の隠れた複雑な関係を捉えることを提案する。
さらに,ハイブリッドユーティリティ機能の構築と,提案モデルに基づく予期せぬ推薦を行うための新しい潜在クロージャ(LC)手法を開発した。
論文 参考訳(メタデータ) (2020-07-27T02:39:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。