論文の概要: A Topology-Aware Positive Sample Set Construction and Feature Optimization Method in Implicit Collaborative Filtering
- arxiv url: http://arxiv.org/abs/2602.18288v1
- Date: Fri, 20 Feb 2026 15:35:48 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-23 18:01:41.361859
- Title: A Topology-Aware Positive Sample Set Construction and Feature Optimization Method in Implicit Collaborative Filtering
- Title(参考訳): 疑似協調フィルタリングにおける位相対応正のサンプルセット構築と特徴最適化手法
- Authors: Jiayi Wu, Zhengyu Wu, Xunkai Li, Rong-Hua Li, Guoren Wang,
- Abstract要約: 負のサンプリング戦略は、データ間隔やクラス不均衡といった問題に対処するために暗黙の協調フィルタリングで広く使われている。
これらの戦略は、しばしば偽陰性を導入し、モデルの潜在的嗜好を正確に学習する能力を妨げている。
位相対応型正のサンプルセット構築と特徴最適化法(TPSC-FO)を提案する。
- 参考スコア(独自算出の注目度): 40.89512526196666
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Negative sampling strategies are widely used in implicit collaborative filtering to address issues like data sparsity and class imbalance. However, these methods often introduce false negatives, hindering the model's ability to accurately learn users' latent preferences. To mitigate this problem, existing methods adjust the negative sampling distribution based on statistical features from model training or the hardness of negative samples. Nevertheless, these methods face two key limitations: (1) over-reliance on the model's current representation capabilities; (2) failure to leverage the potential of false negatives as latent positive samples to guide model learning of user preferences more accurately. To address the above issues, we propose a Topology-aware Positive Sample Set Construction and Feature Optimization method (TPSC-FO). First, we design a simple topological community-aware false negative identification (FNI) method and observe that topological community structures in interaction networks can effectively identify false negatives. Motivated by this, we develop a topology-aware positive sample set construction module. This module employs a differential community detection strategy to capture topological community structures in implicit feedback, coupled with personalized noise filtration to reliably identify false negatives and convert them into positive samples. Additionally, we introduce a neighborhood-guided feature optimization module that refines positive sample features by incorporating neighborhood features in the embedding space, effectively mitigating noise in the positive samples. Extensive experiments on five real-world datasets and two synthetic datasets validate the effectiveness of TPSC-FO.
- Abstract(参考訳): 負のサンプリング戦略は、データ間隔やクラス不均衡といった問題に対処するために暗黙の協調フィルタリングで広く使われている。
しかし、これらの手法は、しばしば偽陰性を導入し、モデルのユーザの潜伏した好みを正確に学習する能力を妨げている。
この問題を緩和するため、既存の手法は、モデルトレーニングの統計的特徴や負のサンプルの硬さに基づいて、負のサンプリング分布を調整する。
それにもかかわらず、これらの手法は、(1)モデルの現在の表現能力を過度に信頼すること、(2)潜在陽性サンプルとして偽陰性の可能性を活用することに失敗して、モデル学習におけるユーザの嗜好をより正確に導くこと、の2つの重要な制限に直面している。
上記の課題に対処するため,我々はTPSC-FO (Topology-aware Positive Sample Set Construction and Feature Optimization method) を提案する。
まず、単純な位相的コミュニティ対応偽陰性識別法(FNI)を設計し、相互作用ネットワークにおける位相的コミュニティ構造が偽陰性を効果的に識別できることを観察する。
そこで我々はトポロジを意識した正のサンプルセット構築モジュールを開発した。
このモジュールは、暗黙のフィードバックでトポロジカルなコミュニティ構造を捉え、パーソナライズされたノイズフィルタと組み合わせて、偽陰性を確実に識別し、正のサンプルに変換する。
さらに, 組込み空間に近傍特徴を組み込むことにより, 正のサンプル特徴を洗練し, 正のサンプルの雑音を効果的に緩和する特徴最適化モジュールを導入する。
5つの実世界のデータセットと2つの合成データセットに関する大規模な実験により、TPSC-FOの有効性が検証された。
関連論文リスト
- Dual-Tree LLM-Enhanced Negative Sampling for Implicit Collaborative Filtering [40.89512526196666]
大型言語モデル(LLM)は推奨システムにおいて有望であることを示している。
既存の方法はテキスト情報とタスク固有の微調整に依存しており、実用性に制限がある。
テキストフリーかつ微調整不要なデュアルトレー型負サンプリング法(DTL-NS)を提案する。
論文 参考訳(メタデータ) (2026-02-20T14:32:41Z) - Can LLM-Driven Hard Negative Sampling Empower Collaborative Filtering? Findings and Potentials [9.668242919588199]
強い負のサンプルはモデル収束を加速し、決定境界を最適化する。
本稿ではセマンティックネガティブサンプリングの概念を紹介する。
協調信号によって制御される微調整LDMに基づくHNLMRecというフレームワークを提案する。
論文 参考訳(メタデータ) (2025-04-07T04:39:45Z) - Self-Supervised Dataset Distillation for Transfer Learning [77.4714995131992]
ラベルなしデータセットを、効率的な自己教師付き学習(SSL)のための小さな合成サンプル群に蒸留する新しい問題を提案する。
両レベル最適化におけるSSL目標に対する合成サンプルの勾配は、データ拡張やマスキングから生じるランダム性から、テキストバイアスを受けていることを最初に証明する。
転送学習を含む様々な応用における本手法の有効性を実証的に検証する。
論文 参考訳(メタデータ) (2023-10-10T10:48:52Z) - Rethinking Collaborative Metric Learning: Toward an Efficient
Alternative without Negative Sampling [156.7248383178991]
コラボレーティブ・メトリック・ラーニング(CML)パラダイムはレコメンデーション・システム(RS)分野に広く関心を集めている。
負のサンプリングが一般化誤差のバイアス付き推定に繋がることがわかった。
そこで我々は,SFCML (textitSampling-Free Collaborative Metric Learning) という名前のCMLに対して,負のサンプリングを伴わない効率的な手法を提案する。
論文 参考訳(メタデータ) (2022-06-23T08:50:22Z) - Rethinking InfoNCE: How Many Negative Samples Do You Need? [54.146208195806636]
半定量的理論フレームワークを用いて, InfoNCE に最適化された負のサンプル数について検討した。
トレーニングの有効性関数を最大化する$K$値を用いて,最適負サンプリング比を推定する。
論文 参考訳(メタデータ) (2021-05-27T08:38:29Z) - Scalable Personalised Item Ranking through Parametric Density Estimation [53.44830012414444]
暗黙のフィードバックから学ぶことは、一流問題の難しい性質のために困難です。
ほとんどの従来の方法は、一級問題に対処するためにペアワイズランキングアプローチとネガティブサンプラーを使用します。
本論文では,ポイントワイズと同等の収束速度を実現する学習対ランクアプローチを提案する。
論文 参考訳(メタデータ) (2021-05-11T03:38:16Z) - Relation-aware Graph Attention Model With Adaptive Self-adversarial
Training [29.240686573485718]
本稿では,不均一なマルチリレーショナルグラフにおける関係予測タスクのエンドツーエンドソリューションについて述べる。
特にパイプライン内の2つのビルディングブロック、すなわちヘテロジニアスグラフ表現学習と負のサンプリングに対処する。
パラメータフリーな負のサンプリング手法であるadaptive self-adversarial (asa) 負のサンプリングを導入する。
論文 参考訳(メタデータ) (2021-02-14T16:11:56Z) - Structure Aware Negative Sampling in Knowledge Graphs [18.885368822313254]
対照的な学習アプローチの重要な側面は、強い負のサンプルを生成する汚職分布の選択である。
我々は,ノードのkホップ近傍から負のサンプルを選択することで,リッチグラフ構造を利用した安価な負のサンプリング戦略であるStructure Aware Negative Smpling (SANS)を提案する。
論文 参考訳(メタデータ) (2020-09-23T19:57:00Z) - Simplify and Robustify Negative Sampling for Implicit Collaborative
Filtering [42.832851785261894]
本稿では,まず,モデル学習において潜在的に重要な事例が少数存在することを実証的に観察し,ネガティブな事例を新たに理解する。
次に、メモリに格納された高分散サンプルを好んで、修正されていない偽陰性問題に取り組む。
2つの合成データセットと3つの実世界のデータセットの実証結果は、我々の負サンプリング法の堅牢性と優位性を示している。
論文 参考訳(メタデータ) (2020-09-07T19:08:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。