論文の概要: ICPE: An Item Cluster-Wise Pareto-Efficient Framework for Recommendation Debiasing
- arxiv url: http://arxiv.org/abs/2109.12887v5
- Date: Sat, 01 Mar 2025 22:46:43 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-04 13:03:23.211155
- Title: ICPE: An Item Cluster-Wise Pareto-Efficient Framework for Recommendation Debiasing
- Title(参考訳): ICPE: Recommendation Debiasingのためのアイテムクラスタワイズパレート効率の良いフレームワーク
- Authors: Yule Wang, Xin Xin, Yue Ding, Yunzhe Li, Dong Wang,
- Abstract要約: そこで本研究では,クラスタ単位の多目的最適化の観点から,推薦の偏りの中心的テーマについて検討する。
トレーニングプロセスで人気が異なるさまざまなアイテムクラスタ上での学習のバランスをとることを目的とした,モデルに依存しないフレームワークであるItem Cluster-Wiseを提案する。
より詳しくは、推奨モデルが人気が異なるすべてのアイテムクラスタのバランスをとるべきであるとして、アイテムクラスタの最適化ターゲットを定義します。
- 参考スコア(独自算出の注目度): 7.100121083949393
- License:
- Abstract: Recommender system based on historical user-item interactions is of vital importance for web-based services. However, the observed data used to train the recommender model suffers from severe bias issues. Practically, the item frequency distribution of the dataset is a highly skewed power-law distribution. Interactions of a small fraction of head items account for almost the whole training data. The normal training paradigm from such biased data tends to repetitively generate recommendations from the head items, which further exacerbates the biases and affects the exploration of potentially interesting items from the niche set. In this work, we innovatively explore the central theme of recommendation debiasing from an item cluster-wise multi-objective optimization perspective. Aiming to balance the learning on various item clusters that differ in popularity during the training process, we propose a model-agnostic framework namely Item Cluster-Wise Pareto-Efficient Recommendation (ICPE). In detail, we define our item cluster-wise optimization target as the recommender model should balance all item clusters that differ in popularity, thus we set the model learning on each item cluster as a unique optimization objective. To achieve this goal, we first explore items' popularity levels from a novel causal reasoning perspective. Then, we devise popularity discrepancy-based bisecting clustering to separate the item clusters. Next, we adaptively find the overall harmonious gradient direction for cluster-wise optimization objectives from a Pareto-efficient solver. Finally, in the prediction stage, we perform counterfactual inference to further eliminate the impact of global propensity. Extensive experimental results verify the superiorities of ICPE on overall recommendation performance and biases elimination.
- Abstract(参考訳): 歴史的ユーザ・イテムインタラクションに基づくレコメンダシステムは、Webベースのサービスにとって極めて重要である。
しかしながら、レコメンダモデルをトレーニングするために使用される観測データは、深刻なバイアスの問題に悩まされている。
実際、データセットのアイテム頻度分布は、非常に歪んだパワーロー分布である。
ごく少数のヘッドアイテムのインタラクションは、ほぼすべてのトレーニングデータの原因となります。
このようなバイアスのあるデータからの通常のトレーニングパラダイムは、繰り返しヘッドアイテムからレコメンデーションを生成する傾向があり、バイアスをさらに悪化させ、ニッチなセットから潜在的に興味深いアイテムの探索に影響を与える。
本研究では,クラスタ単位の多目的最適化の観点から,リコメンデーション・デバイアスの中心的テーマを革新的に探求する。
本研究は,トレーニングプロセスで人気が異なるさまざまな項目クラスタ上での学習のバランスをとることを目的として,ICPE(Item Cluster-Wise Pareto-Efficient Recommendation)というモデルに依存しないフレームワークを提案する。
より詳しくは、商品クラスタの最適化対象を、人気が異なる全てのアイテムクラスタのバランスをとるよう推奨するモデルとして定義し、各アイテムクラスタ上でのモデル学習を、ユニークな最適化目標として設定する。
この目的を達成するために、我々はまず、新しい因果推論の観点からアイテムの人気レベルを探求する。
そして、人気不一致に基づく二分法クラスタリングを考案し、アイテムクラスタを分離する。
次に,Pareto- efficient solver を用いて,クラスタワイズ最適化目標に対する全調和勾配方向を適応的に求める。
最後に, 予測段階では, 地球的正当性の影響をさらに排除するために, 反実的推論を行う。
ICPEの総合的な推奨性能とバイアス除去に対する優位性を検証する。
関連論文リスト
- ComPO: Community Preferences for Language Model Personalization [122.54846260663922]
ComPOは、言語モデルにおける好みの最適化をパーソナライズする手法である。
ComPRedはRedditからコミュニティレベルの好みを持った質問応答データセットです。
論文 参考訳(メタデータ) (2024-10-21T14:02:40Z) - Learning Recommender Systems with Soft Target: A Decoupled Perspective [49.83787742587449]
そこで本研究では,ソフトラベルを活用することで,目的を2つの側面として捉えるために,分離されたソフトラベル最適化フレームワークを提案する。
本稿では,ラベル伝搬アルゴリズムをモデル化したソフトラベル生成アルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-10-09T04:20:15Z) - Ordinal Preference Optimization: Aligning Human Preferences via NDCG [28.745322441961438]
我々は、NDCGを異なる代理損失で近似することで、エンドツーエンドの選好最適化アルゴリズムを開発する。
OPOは、AlpacaEvalのような評価セットや一般的なベンチマークにおいて、既存のペアワイズおよびリストワイズアプローチよりも優れています。
論文 参考訳(メタデータ) (2024-10-06T03:49:28Z) - Beyond Similarity: Personalized Federated Recommendation with Composite Aggregation [22.359428566363945]
フェデレーションレコメンデーションは、大規模なデバイスからローカルモデルを集約することで、グローバルな知識を集めることを目的としている。
現在の手法は主に、連合視覚コミュニティによって発明された集約関数を利用して、類似したクライアントからのパラメータを集約する。
複合アグリゲーション(FedCA)を用いたパーソナライズド・フェデレーション・レコメンデーション・モデルを提案する。
論文 参考訳(メタデータ) (2024-06-06T10:17:52Z) - MaxMin-RLHF: Alignment with Diverse Human Preferences [101.57443597426374]
Reinforcement Learning from Human Feedback (RLHF) は、言語モデルと人間の嗜好を一致させる。
予測最大化アルゴリズムを用いて嗜好分布の混合を学習し、人間の嗜好をよりよく表現する。
従来のRLHFアルゴリズムよりも16%以上の勝利率向上を実現している。
論文 参考訳(メタデータ) (2024-02-14T03:56:27Z) - ClusterSeq: Enhancing Sequential Recommender Systems with Clustering
based Meta-Learning [3.168790535780547]
ClusterSeqはメタラーニングクラスタリングに基づくシーケンスレコメンダシステムである。
ユーザシーケンスの動的情報を利用して、サイド情報がない場合でもアイテム予測精度を高める。
提案手法は平均相反ランク(MRR)において16~39%の大幅な改善を実現する。
論文 参考訳(メタデータ) (2023-07-25T18:53:24Z) - Deep Negative Correlation Classification [82.45045814842595]
既存のディープアンサンブル手法は、多くの異なるモデルをナビゲートし、予測を集約する。
深部負相関分類(DNCC)を提案する。
DNCCは、個々の推定器が正確かつ負の相関を持つ深い分類アンサンブルを生成する。
論文 参考訳(メタデータ) (2022-12-14T07:35:20Z) - Cross Pairwise Ranking for Unbiased Item Recommendation [57.71258289870123]
我々はCPR(Cross Pairwise Ranking)という新しい学習パラダイムを開発する。
CPRは、露出メカニズムを知らずに不偏の推奨を達成する。
理論的には、この方法が学習に対するユーザ/イテムの適合性の影響を相殺することを証明する。
論文 参考訳(メタデータ) (2022-04-26T09:20:27Z) - Unbiased Pairwise Learning to Rank in Recommender Systems [4.058828240864671]
アルゴリズムをランク付けする偏見のない学習は、候補をアピールし、既に単一の分類ラベルを持つ多くのアプリケーションに適用されている。
本稿では,この課題に対処するための新しい非バイアス付きLTRアルゴリズムを提案する。
パブリックベンチマークデータセットと内部ライブトラフィックを用いた実験結果から,分類ラベルと連続ラベルのいずれにおいても提案手法の優れた結果が得られた。
論文 参考訳(メタデータ) (2021-11-25T06:04:59Z) - CRACT: Cascaded Regression-Align-Classification for Robust Visual
Tracking [97.84109669027225]
改良された提案改良モジュールCascaded Regression-Align- Classification (CRAC)を導入する。
CRACは多くのベンチマークで最先端のパフォーマンスを得る。
OTB-2015、UAV123、NfS、VOT-2018、TrackingNet、GOT-10k、LaSOTを含む7つのベンチマークの実験において、我々のCRACTは最先端の競合他社と比較して非常に有望な結果を示している。
論文 参考訳(メタデータ) (2020-11-25T02:18:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。