論文の概要: Divergence Meets Consensus: A Multi-Source Negative Sampling Framework for Sequential Recommendation
- arxiv url: http://arxiv.org/abs/2605.19651v1
- Date: Tue, 19 May 2026 10:42:23 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-20 15:03:09.283373
- Title: Divergence Meets Consensus: A Multi-Source Negative Sampling Framework for Sequential Recommendation
- Title(参考訳): DivergenceがConsensusに - シーケンシャルレコメンデーションのためのマルチソースネガティブサンプリングフレームワーク
- Authors: Yuanzi Li, Lingjie Wang, Jingyu Zhao, Zihang Tian, Yuhan Wang, Lei Wang, Xu Chen,
- Abstract要約: 「Teacher-Peer-Self」フレームワークは、ヴィゴツキーのZPD理論に触発されたものである。
マルチソーススコアリング、分散再ランク付け、コンセンサス蒸留が組み込まれている。
常に最先端のネガティブサンプリング手法より優れています。
- 参考スコア(独自算出の注目度): 12.425187572716574
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Negative sampling is significant for training sequential recommendation models under implicit feedback. The predominant strategy, self-guided hard negative sampling, selects negatives based on the model's current state but suffers from three limitations: (1) the coupling between sampling and model updates triggers a vicious cycle that drives the model into local optima; (2) relying on current model parameters narrows sampling to a small region of the item space, reducing diversity and harming generalization; (3) identifying a hard negative requires scoring the entire candidate pool, causing substantial computational overhead with minimal information gain. To address these challenges, we propose MDCNS (Multi-source Divergence-Consensus for Negative Sampling), a novel "Teacher-Peer-Self" framework inspired by Vygotsky's Zone of Proximal Development (ZPD) theory. The proposed method comprises three components, including multi-source scoring, divergence re-ranking, and consensus distillation. Firstly, multi-source scoring incorporates peer and ensemble teacher models to inject external negative signals and break the self-reinforcement loop. Then, divergence re-ranking exploits prediction discrepancy between self and peer models to enhance sampling diversity. Finally, consensus distillation aligns the self model with the teacher via KL divergence, simultaneously improving computational cost utilization. Extensive experiments on six real-world datasets and five backbone models show that MDCNS consistently outperforms state-of-the-art negative sampling methods, demonstrating strong effectiveness and generalization.
- Abstract(参考訳): 負のサンプリングは、暗黙のフィードバックの下でシーケンシャルなレコメンデーションモデルをトレーニングするために重要である。
1)サンプリングとモデル更新の結合は、モデルを局所的最適に駆動する悪循環をトリガーし、(2)現在のモデルパラメータに依存することにより、アイテム空間の小さな領域にサンプリングを絞り、多様性を減らし、一般化を損なう。
これらの課題に対処するため、ヴィゴツキーのZPD理論に触発された新しい「Teacher-Peer-Self」フレームワークであるMDCNS(Multi-source Divergence-Consensus for Negative Smpling)を提案する。
提案手法は,マルチソーススコアリング,分散再ランク付け,コンセンサス蒸留を含む3つの成分からなる。
第一に、マルチソーススコアリングでは、ペアとアンサンブルの教師モデルを用いて外部の負の信号を注入し、自己強化ループを破る。
次に、ばらつきを再ランク付けし、自己モデルとピアモデルとの差を予測し、サンプリングの多様性を高める。
最後に、コンセンサス蒸留は、KL分散による自己モデルと教師との整合を図り、同時に計算コストの利用率を向上する。
6つの実世界のデータセットと5つのバックボーンモデルに対する大規模な実験により、MDCNSは一貫して最先端の負のサンプリング法より優れており、強い効果と一般化を示している。
関連論文リスト
- Improving LLM-based Recommendation with Self-Hard Negatives from Intermediate Layers [80.55429742713623]
ILRecはLLMベースのレコメンデーションシステムのための新しい好みの微調整フレームワークである。
負の信号に対してトークンレベルの報酬を割り当てるための軽量な協調フィルタリングモデルを提案する。
3つのデータセットの実験は、LLMベースのレコメンデータシステムの性能向上におけるILRecの有効性を示している。
論文 参考訳(メタデータ) (2026-02-19T14:37:43Z) - G$^2$RPO: Granular GRPO for Precise Reward in Flow Models [74.21206048155669]
本稿では,サンプリング方向の高精度かつ包括的な報酬評価を実現する新しいグラニュラー-GRPO(G$2$RPO)フレームワークを提案する。
複数の拡散スケールで計算された利点を集約するマルチグラニュラリティ・アドバンテージ・インテグレーション・モジュールを導入する。
G$2$RPOは既存のフローベースGRPOベースラインを著しく上回る。
論文 参考訳(メタデータ) (2025-10-02T12:57:12Z) - Causal Negative Sampling via Diffusion Model for Out-of-Distribution Recommendation [7.354459720418281]
ヒューリスティックな負サンプリングは、予め定義された候補プールから様々な硬度レベルの負のサンプルを選択することにより、推薦性能を高める。
候補プールにおける未観測環境共創者は、偽硬陰性(FHNS)をサンプリング法で導入する可能性がある
本稿では,この問題を解決するためにDiffusion (CNSDiff) を用いたCausal Negative Smpling という新しい手法を提案する。
論文 参考訳(メタデータ) (2025-08-10T08:55:21Z) - Dissecting Long-Chain-of-Thought Reasoning Models: An Empirical Study [91.78803511141975]
この研究は、強化学習のスケーリングにおける正と負のサンプルの役割に焦点を当てている。
グループ相対的政策最適化において、サンプルの半数以上がゼロの優位性を持つような実質的なデータ非効率性を同定する。
本研究では,様々な推論モデルとベンチマークの不安定な性能について検討し,不明瞭な結果を伴う不確実な問題に対する不安定性について考察した。
論文 参考訳(メタデータ) (2025-06-05T11:47:10Z) - Dimension Independent Mixup for Hard Negative Sample in Collaborative
Filtering [36.26865960551565]
否定的なサンプリングは、暗黙のフィードバックでCFベースのモデルをトレーニングする上で重要な役割を果たす。
そこで本研究では,CFモデルトレーニングのためのエリアワイドサンプリング法であるDINS(Dimension Independent Mixup for Hard Negative Smpling)を提案する。
我々の研究は、新しい視点に寄与し、エリアワイドサンプリングを導入し、DINSをネガティブサンプリングのための新しいアプローチとして提示する。
論文 参考訳(メタデータ) (2023-06-28T04:03:31Z) - Distributionally Robust Models with Parametric Likelihood Ratios [123.05074253513935]
3つの単純なアイデアにより、より広いパラメトリックな確率比のクラスを用いてDROでモデルを訓練することができる。
パラメトリック逆数を用いてトレーニングしたモデルは、他のDROアプローチと比較して、サブポピュレーションシフトに対して一貫して頑健であることがわかった。
論文 参考訳(メタデータ) (2022-04-13T12:43:12Z) - Distribution-Aware Single-Stage Models for Multi-Person 3D Pose
Estimation [29.430404703883084]
本稿では,多人数の3Dポーズ推定問題に対処する新しいDASモデルを提案する。
提案するDASモデルでは,3次元カメラ空間における人物位置と人体関節をワンパスで同時に位置決めする。
CMU Panoptic と MuPoTS-3D のベンチマークに関する総合的な実験は、提案したDASモデルの優れた効率を実証している。
論文 参考訳(メタデータ) (2022-03-15T07:30:27Z) - Solving Inefficiency of Self-supervised Representation Learning [87.30876679780532]
既存のコントラスト学習法は、非常に低い学習効率に苦しむ。
アンダークラスタリングとオーバークラスタリングの問題は、学習効率の大きな障害である。
中央三重項損失を用いた新しい自己監督学習フレームワークを提案する。
論文 参考訳(メタデータ) (2021-04-18T07:47:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。