論文の概要: Simplify and Robustify Negative Sampling for Implicit Collaborative
Filtering
- arxiv url: http://arxiv.org/abs/2009.03376v1
- Date: Mon, 7 Sep 2020 19:08:26 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-21 03:34:07.016022
- Title: Simplify and Robustify Negative Sampling for Implicit Collaborative
Filtering
- Title(参考訳): 入出力協調フィルタリングにおける負サンプリングの簡易化とロバスト化
- Authors: Jingtao Ding, Yuhan Quan, Quanming Yao, Yong Li, Depeng Jin
- Abstract要約: 本稿では,まず,モデル学習において潜在的に重要な事例が少数存在することを実証的に観察し,ネガティブな事例を新たに理解する。
次に、メモリに格納された高分散サンプルを好んで、修正されていない偽陰性問題に取り組む。
2つの合成データセットと3つの実世界のデータセットの実証結果は、我々の負サンプリング法の堅牢性と優位性を示している。
- 参考スコア(独自算出の注目度): 42.832851785261894
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Negative sampling approaches are prevalent in implicit collaborative
filtering for obtaining negative labels from massive unlabeled data. As two
major concerns in negative sampling, efficiency and effectiveness are still not
fully achieved by recent works that use complicate structures and overlook risk
of false negative instances. In this paper, we first provide a novel
understanding of negative instances by empirically observing that only a few
instances are potentially important for model learning, and false negatives
tend to have stable predictions over many training iterations. Above findings
motivate us to simplify the model by sampling from designed memory that only
stores a few important candidates and, more importantly, tackle the untouched
false negative problem by favouring high-variance samples stored in memory,
which achieves efficient sampling of true negatives with high-quality.
Empirical results on two synthetic datasets and three real-world datasets
demonstrate both robustness and superiorities of our negative sampling method.
- Abstract(参考訳): 負のサンプリングアプローチは、大量のラベルのないデータから負のラベルを取得するための暗黙の協調フィルタリングにおいて一般的である。
負のサンプリングにおける2つの主要な関心事として、偽の負のインスタンスの複雑な構造と見落としのリスクを利用する最近の研究によって、効率と効果がまだ完全には達成されていない。
本稿では,まず,モデル学習においてわずか数個のインスタンスが潜在的に重要であること,偽陰性が多くのトレーニングイテレーションに対して安定した予測を持つ傾向があることを実証的に観察することで,負のインスタンスの新たな理解を提供する。
以上の結果から,いくつかの重要な候補のみを記憶する設計メモリから抽出し,さらに重要な点として,メモリに格納された高分散サンプルを選好することで,非タッチの偽陰性問題に対処し,高品質な真の負の効率的なサンプリングを実現することにより,モデルを単純化する動機となった。
2つの合成データセットと3つの実世界のデータセットの実証結果は、我々の負サンプリング法の堅牢性と優位性を示している。
関連論文リスト
- Your Negative May not Be True Negative: Boosting Image-Text Matching
with False Negative Elimination [62.18768931714238]
提案手法は, サンプリングによる新規な偽陰性除去 (FNE) 戦略である。
その結果,提案した偽陰性除去戦略の優位性が示された。
論文 参考訳(メタデータ) (2023-08-08T16:31:43Z) - Better Sampling of Negatives for Distantly Supervised Named Entity
Recognition [39.264878763160766]
本稿では, 正の正の正の正の正の正の正の正の正の正の正の正の正の正の正の正の正の正の正の正の正の正の正の正の正の正の正の正の正の正の正の正の正の正の正の正の正の正の正の正の正
提案手法は,4つの遠隔教師付きNERデータセットに対して一貫した性能向上を実現する。
論文 参考訳(メタデータ) (2023-05-22T15:35:39Z) - Rethinking Negative Sampling for Unlabeled Entity Problem in Named
Entity Recognition [47.273602658066196]
ラベルのないエンティティは、名前付きエンティティ認識モデルのパフォーマンスを著しく劣化させる。
我々は、なぜ負のサンプリングが理論的にも経験的にも成功するのかを分析する。
負サンプリングのための重み付き適応サンプリング分布を提案する。
論文 参考訳(メタデータ) (2021-08-26T07:02:57Z) - Rethinking InfoNCE: How Many Negative Samples Do You Need? [54.146208195806636]
半定量的理論フレームワークを用いて, InfoNCE に最適化された負のサンプル数について検討した。
トレーニングの有効性関数を最大化する$K$値を用いて,最適負サンプリング比を推定する。
論文 参考訳(メタデータ) (2021-05-27T08:38:29Z) - Revisiting the Negative Data of Distantly Supervised Relation Extraction [17.00557139562208]
遠隔監視は、関係抽出のための多くのトレーニングサンプルを自動的に生成する。
また、ノイズラベルと不均衡なトレーニングデータという2つの大きな問題も発生している。
そこで我々はtextscReRe と呼ばれるパイプライン手法を提案し,文レベルの関係検出を行い,対象/対象抽出を行う。
論文 参考訳(メタデータ) (2021-05-21T06:44:19Z) - Contrastive Attraction and Contrastive Repulsion for Representation
Learning [131.72147978462348]
コントラスト学習(CL)法は,複数の負のサンプルに対して,エンコーダが各正のサンプルと対比する自己超越的な方法でデータ表現を学習する。
最近のCL法は、ImageNetのような大規模データセットで事前訓練された場合、有望な結果を得た。
自己グループ内の正と負のサンプルを別々に比較し、正と負の群を対比して進行する2つのCL戦略を提案する。
論文 参考訳(メタデータ) (2021-05-08T17:25:08Z) - Doubly Contrastive Deep Clustering [135.7001508427597]
本稿では、サンプルビューとクラスビューの両方でコントラスト損失を構築する新しい二重コントラストディープクラスタリング(DCDC)フレームワークを紹介します。
具体的には、サンプルビューに対して、元のサンプルとその拡張バージョンのクラス分布を正のサンプルペアとして設定する。
クラスビューでは、クラスのサンプル分布から正のペアと負のペアを構築します。
このように、2つのコントラスト損失は、サンプルとクラスレベルでのミニバッチサンプルのクラスタリング結果をうまく制限します。
論文 参考訳(メタデータ) (2021-03-09T15:15:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。