論文の概要: Shapley Value-driven Data Pruning for Recommender Systems
- arxiv url: http://arxiv.org/abs/2505.22057v1
- Date: Wed, 28 May 2025 07:27:59 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-29 17:35:50.470186
- Title: Shapley Value-driven Data Pruning for Recommender Systems
- Title(参考訳): 共有価値駆動型レコメンダシステムのためのデータプルーニング
- Authors: Yansen Zhang, Xiaokun Zhang, Ziqiang Cui, Chen Ma,
- Abstract要約: 共有価値駆動評価(Shapley Value-Driven Valuation, SVV)は、モデルトレーニングに対する客観的な影響に基づいてインタラクションを評価するフレームワークである。
SVVは、高い値との相互作用を強調しながら、低い値を下書きし、レコメンダシステムに効果的なデータプルーニングを実現する。
4つの実世界のデータセットでの実験では、SVVは精度とロバスト性の両方で既存のデノナイジング手法よりも優れていた。
- 参考スコア(独自算出の注目度): 6.170723867840994
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Recommender systems often suffer from noisy interactions like accidental clicks or popularity bias. Existing denoising methods typically identify users' intent in their interactions, and filter out noisy interactions that deviate from the assumed intent. However, they ignore that interactions deemed noisy could still aid model training, while some ``clean'' interactions offer little learning value. To bridge this gap, we propose Shapley Value-driven Valuation (SVV), a framework that evaluates interactions based on their objective impact on model training rather than subjective intent assumptions. In SVV, a real-time Shapley value estimation method is devised to quantify each interaction's value based on its contribution to reducing training loss. Afterward, SVV highlights the interactions with high values while downplaying low ones to achieve effective data pruning for recommender systems. In addition, we develop a simulated noise protocol to examine the performance of various denoising approaches systematically. Experiments on four real-world datasets show that SVV outperforms existing denoising methods in both accuracy and robustness. Further analysis also demonstrates that our SVV can preserve training-critical interactions and offer interpretable noise assessment. This work shifts denoising from heuristic filtering to principled, model-driven interaction valuation.
- Abstract(参考訳): レコメンダシステムは、しばしば偶然クリックや人気バイアスのようなノイズの多い相互作用に悩まされる。
既存の denoising メソッドは、通常、ユーザのインタラクションにおける意図を特定し、想定された意図から逸脱するノイズの多いインタラクションをフィルタリングする。
しかし、彼らは相互作用がモデルトレーニングに役立つと見なされるのを無視する一方で、'clean'の相互作用は学習価値をほとんど提供しない。
このギャップを埋めるために、主観的意図の仮定ではなく、モデルトレーニングに対する客観的な影響に基づいて相互作用を評価するフレームワークであるShapley Value-Driven Valuation(SVV)を提案する。
SVVでは、実時間シェープ値推定法が考案され、各インタラクションの値がトレーニング損失の低減に寄与することに基づいて定量化される。
その後、SVVは高い値との相互作用を強調しながら、低い値を下書きし、レコメンダシステムに効果的なデータプルーニングを実現する。
さらに,様々な聴覚的アプローチの性能を体系的に検証するシミュレート・ノイズ・プロトコルを開発した。
4つの実世界のデータセットでの実験では、SVVは精度とロバスト性の両方で既存のデノナイジング手法よりも優れていた。
さらに,我々のSVVは,トレーニングクリティカルな相互作用を保ち,解釈可能なノイズアセスメントを提供することを示す。
この作業は、ヒューリスティックなフィルタリングから、原則付きモデル駆動インタラクションバリュエーションへの移行である。
関連論文リスト
- Enhancing Federated Survival Analysis through Peer-Driven Client Reputation in Healthcare [1.2289361708127877]
Federated Learningは、患者のデータのプライバシを損なうことなく、協調的なモデルトレーニングを可能にすることで、デジタルヘルスを大いに約束する。
本稿では、分散化されたピアフィードバックとクラスタリングに基づくノイズハンドリングを統合した、フェデレーション型医療のためのピア駆動評価機構を提案する。
クライアント側のモデル更新に差分プライバシを適用することで、評判計算中に機密情報が保護されることが保証される。
論文 参考訳(メタデータ) (2025-05-22T03:49:51Z) - DynaNoise: Dynamic Probabilistic Noise Injection for Defending Against Membership Inference Attacks [6.610581923321801]
会員推論攻撃(MIA)は、トレーニングデータセットのプライバシーに重大なリスクをもたらす。
従来の緩和技術は、トレーニングや推論中に一定量のノイズを注入することに依存している。
問合せ感度に基づいて動的にノイズ注入を変調する適応型アプローチであるDynaNoiseを提案する。
論文 参考訳(メタデータ) (2025-05-19T17:07:00Z) - Reinforced Interactive Continual Learning via Real-time Noisy Human Feedback [59.768119380109084]
本稿では,AIモデルがリアルタイムフィードバックから新たなスキルを動的に学習する対話型連続学習パラダイムを提案する。
大規模言語モデル(LLM)を活用した強化型対話型連続学習フレームワークRiCLを提案する。
我々のRiCLアプローチは、最先端のオンライン連続学習とノイズラベル学習の既存の組み合わせを大幅に上回っている。
論文 参考訳(メタデータ) (2025-05-15T03:22:03Z) - Large Language Model Enhanced Hard Sample Identification for Denoising Recommendation [4.297249011611168]
暗黙のフィードバックは、しばしばレコメンデーションシステムを構築するために使われる。
従来の研究では、分散したパターンに基づいてノイズの多いサンプルを識別することで、これを緩和しようと試みてきた。
大規模言語モデル強化型ハードサンプルデノゲーションフレームワークを提案する。
論文 参考訳(メタデータ) (2024-09-16T14:57:09Z) - Impact of Noisy Supervision in Foundation Model Learning [91.56591923244943]
本論文は、事前学習データセットにおけるノイズの性質を包括的に理解し分析する最初の研究である。
雑音の悪影響を緩和し、一般化を改善するため、特徴空間に適応するチューニング法(NMTune)を提案する。
論文 参考訳(メタデータ) (2024-03-11T16:22:41Z) - Noisy Correspondence Learning with Self-Reinforcing Errors Mitigation [63.180725016463974]
クロスモーダル検索は、実際は精力的な、十分に整合した大規模データセットに依存している。
我々は、新しい雑音対応学習フレームワーク、textbfSelf-textbfReinforcing textbfErrors textbfMitigation(SREM)を導入する。
論文 参考訳(メタデータ) (2023-12-27T09:03:43Z) - WSLRec: Weakly Supervised Learning for Neural Sequential Recommendation
Models [24.455665093145818]
我々は、WSLRecと呼ばれる新しいモデルに依存しないトレーニング手法を提案し、3段階のフレームワーク(事前学習、トップ$k$マイニング、本質的、微調整)を採用する。
WSLRec は、BR や ItemCF のようなモデルフリーメソッドから、余分な弱い監督のモデルを事前訓練することで、不完全性の問題を解決すると同時に、最上位の$k のマイニングを活用して、微調整のための弱い監督の信頼性の高いユーザ・イテム関連を検査することで、不正確な問題を解消する。
論文 参考訳(メタデータ) (2022-02-28T08:55:12Z) - Probabilistic and Variational Recommendation Denoising [56.879165033014026]
暗黙のフィードバックから学ぶことは、推奨システムの適用において最も一般的なケースの1つである。
本稿では,暗黙のフィードバックに対する確率的・変動的推薦を提案する。
提案したDPIとDVAEを4つの最先端レコメンデーションモデルに適用し、3つのデータセットで実験を行う。
論文 参考訳(メタデータ) (2021-05-20T08:59:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。