論文の概要: From Insight to Intervention: Interpretable Neuron Steering for Controlling Popularity Bias in Recommender Systems
- arxiv url: http://arxiv.org/abs/2601.15122v1
- Date: Wed, 21 Jan 2026 16:02:11 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-22 21:27:50.441797
- Title: From Insight to Intervention: Interpretable Neuron Steering for Controlling Popularity Bias in Recommender Systems
- Title(参考訳): インテリジェンスからインターベンションへ:リコメンダシステムにおける人気バイアス制御のための解釈可能なニューロンステアリング
- Authors: Parviz Ahmadov, Masoud Mansoury,
- Abstract要約: 人気度バイアスはレコメンデーションシステムにおいて広範囲にわたる課題であり、いくつかの人気アイテムが注目されている一方、人気度の低いアイテムの大部分は未公開のままである。
本稿では,Sparse Autoencoderを利用するポストホックアプローチであるPopSteerを提案し,リコメンデーションモデルにおける人気バイアスの解釈と緩和を行う。
シーケンシャルレコメンデーションモデルを用いた3つの公開データセットの実験では、PopSteerは正確性に対する最小限の影響でフェアネスを著しく向上し、解釈可能な洞察とフェアネス-正確性トレードオフのきめ細かい制御を提供する。
- 参考スコア(独自算出の注目度): 1.8692254863855962
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Popularity bias is a pervasive challenge in recommender systems, where a few popular items dominate attention while the majority of less popular items remain underexposed. This imbalance can reduce recommendation quality and lead to unfair item exposure. Although existing mitigation methods address this issue to some extent, they often lack transparency in how they operate. In this paper, we propose a post-hoc approach, PopSteer, that leverages a Sparse Autoencoder (SAE) to both interpret and mitigate popularity bias in recommendation models. The SAE is trained to replicate a trained model's behavior while enabling neuron-level interpretability. By introducing synthetic users with strong preferences for either popular or unpopular items, we identify neurons encoding popularity signals through their activation patterns. We then steer recommendations by adjusting the activations of the most biased neurons. Experiments on three public datasets with a sequential recommendation model demonstrate that PopSteer significantly enhances fairness with minimal impact on accuracy, while providing interpretable insights and fine-grained control over the fairness-accuracy trade-off.
- Abstract(参考訳): 人気度バイアスはレコメンデーションシステムにおいて広範囲にわたる課題であり、いくつかの人気アイテムが注目されている一方で、人気度の低いアイテムの大部分は未公開のままである。
この不均衡はレコメンデーションの品質を低下させ、不公平なアイテムの露出につながる。
既存の緩和方法はある程度この問題に対処するが、その運用方法に透明性が欠けていることが多い。
本稿では,Sparse Autoencoder(SAE)を利用したポストホックアプローチであるPopSteerを提案する。
SAEは、ニューロンレベルの解釈性を確保しながら、訓練されたモデルの振る舞いを再現するように訓練されている。
人気項目や不人気項目を強く選好する合成ユーザを導入することで、アクティベーションパターンを通じて人気信号をコードするニューロンを同定する。
次に、最も偏ったニューロンの活性化を調整することで推奨する。
シーケンシャルレコメンデーションモデルを用いた3つの公開データセットの実験では、PopSteerは正確性に対する最小限の影響でフェアネスを著しく向上し、解釈可能な洞察とフェアネス-正確性トレードオフのきめ細かい制御を提供する。
関連論文リスト
- The Unfairness of Multifactorial Bias in Recommendation [68.35079031029616]
人気バイアスと肯定バイアスは推薦システムにおいて顕著なバイアス源である。
本研究では,多因子バイアスが項目側の公平性にどのように影響するかを検討する。
我々は、多因子バイアスを軽減するために、パーセンタイルに基づく評価変換を前処理戦略として適用する。
論文 参考訳(メタデータ) (2026-01-19T08:37:43Z) - Opening the Black Box: Interpretable Remedies for Popularity Bias in Recommender Systems [1.8692254863855962]
人気度バイアスは、少数の人気アイテムが不均等な注目を集めるレコメンデーションシステムにおいて、よく知られた課題である。
この不均衡は、しばしば推奨品質の低下とアイテムの不公平な露出をもたらす。
本稿では,Sparse Autoencoder を用いたポストホック手法を提案する。
論文 参考訳(メタデータ) (2025-08-24T10:59:56Z) - PBiLoss: Popularity-Aware Regularization to Improve Fairness in Graph-Based Recommender Systems [1.0128808054306186]
PBiLossは、グラフベースのレコメンデータモデルにおいて、人気バイアスを明示的に防止するために設計された正規化に基づく損失関数である。
PBiLoss は,PRU (Popularity-Rank correlation for Users) とPRI (Popularity-Rank correlation for Items) の削減によって,公正性を著しく向上させることを示した。
論文 参考訳(メタデータ) (2025-07-25T08:29:32Z) - Finding Interest Needle in Popularity Haystack: Improving Retrieval by Modeling Item Exposure [8.3095709445007]
本稿では、アイテムの露出確率を明示的にモデル化し、推論時に検索ステージランキングを調整する、露出認識型検索スコアリング手法を提案する。
実世界のビデオレコメンデーションシステムにおけるオンラインA/B実験によるアプローチの有効性を検証し、一意に検索されたアイテムの25%増加と、過度な人気コンテンツの優位性の40%低下を実証した。
本研究は,検索段階で人気バイアスを緩和するためのスケーラブルでデプロイ可能なソリューションを構築し,バイアス認識のパーソナライゼーションのための新しいパラダイムを提供する。
論文 参考訳(メタデータ) (2025-03-31T00:04:01Z) - Towards Popularity-Aware Recommendation: A Multi-Behavior Enhanced Framework with Orthogonality Constraint [4.137753517504481]
Top-K$レコメンデーションは、潜伏したユーザの好みを推測し、パーソナライズされたレコメンデーションを生成する。
マルチビヘイビアのtextbfSide textbfInformation を統合した textbfPopularity-aware top-$K$レコメンデーションアルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-12-26T11:06:49Z) - Going Beyond Popularity and Positivity Bias: Correcting for Multifactorial Bias in Recommender Systems [74.47680026838128]
ユーザインタラクションデータとレコメンダシステム(RS)の2つの典型的なバイアスは、人気バイアスと肯定バイアスである。
項目と評価値の双方に影響される多因子選択バイアスについて検討する。
分散を低減し、最適化の堅牢性を向上させるため、スムースで交互に勾配降下する手法を提案する。
論文 参考訳(メタデータ) (2024-04-29T12:18:21Z) - Off-policy evaluation for learning-to-rank via interpolating the
item-position model and the position-based model [83.83064559894989]
産業レコメンデーションシステムにとって重要なニーズは、製品にデプロイする前に、レコメンデーションポリシーをオフラインで評価する機能である。
我々は、最も人気のある2つの非政治推定器の問題を緩和する新しい推定器を開発する。
特に、InterPOLと呼ばれる新しい推定器は、潜在的に不特定位置ベースモデルのバイアスに対処する。
論文 参考訳(メタデータ) (2022-10-15T17:22:30Z) - Self-supervised debiasing using low rank regularization [59.84695042540525]
純粋な相関は、ディープニューラルネットワークの強いバイアスを引き起こし、一般化能力を損なう可能性がある。
ラベルのないサンプルと互換性のある自己監督型脱バイアスフレームワークを提案する。
注目すべきは,提案フレームワークが自己教師付き学習ベースラインの一般化性能を著しく向上させることである。
論文 参考訳(メタデータ) (2022-10-11T08:26:19Z) - Cross Pairwise Ranking for Unbiased Item Recommendation [57.71258289870123]
我々はCPR(Cross Pairwise Ranking)という新しい学習パラダイムを開発する。
CPRは、露出メカニズムを知らずに不偏の推奨を達成する。
理論的には、この方法が学習に対するユーザ/イテムの適合性の影響を相殺することを証明する。
論文 参考訳(メタデータ) (2022-04-26T09:20:27Z) - PURS: Personalized Unexpected Recommender System for Improving User
Satisfaction [76.98616102965023]
本稿では、予期せぬことを推奨プロセスに組み込んだ、新しいPersonalized Unexpected Recommender System(PURS)モデルについて述べる。
3つの実世界のデータセットに対する大規模なオフライン実験は、提案されたPURSモデルが最先端のベースラインアプローチを大幅に上回っていることを示している。
論文 参考訳(メタデータ) (2021-06-05T01:33:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。