論文の概要: Graph-Based Model-Agnostic Data Subsampling for Recommendation Systems
- arxiv url: http://arxiv.org/abs/2305.16391v1
- Date: Thu, 25 May 2023 18:00:15 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-29 18:46:52.945869
- Title: Graph-Based Model-Agnostic Data Subsampling for Recommendation Systems
- Title(参考訳): 推薦システムのためのグラフベースモデル非依存データサブサンプリング
- Authors: Xiaohui Chen, Jiankai Sun, Taiqing Wang, Ruocheng Guo, Li-Ping Liu,
Aonan Zhang
- Abstract要約: データサブサンプリングはリコメンデーションシステムのトレーニングを高速化するために広く使われている。
ほとんどのサブサンプリング手法はモデルベースであり、データの重要性を測定するために事前訓練されたパイロットモデルを必要とすることが多い。
本稿では,グラフで表される入力データ構造のみを探索し,モデルに依存しないデータサブサンプリング手法を提案する。
- 参考スコア(独自算出の注目度): 29.713557081485995
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Data subsampling is widely used to speed up the training of large-scale
recommendation systems. Most subsampling methods are model-based and often
require a pre-trained pilot model to measure data importance via e.g. sample
hardness. However, when the pilot model is misspecified, model-based
subsampling methods deteriorate. Since model misspecification is persistent in
real recommendation systems, we instead propose model-agnostic data subsampling
methods by only exploring input data structure represented by graphs.
Specifically, we study the topology of the user-item graph to estimate the
importance of each user-item interaction (an edge in the user-item graph) via
graph conductance, followed by a propagation step on the network to smooth out
the estimated importance value.
Since our proposed method is model-agnostic, we can marry the merits of both
model-agnostic and model-based subsampling methods. Empirically, we show that
combing the two consistently improves over any single method on the used
datasets.
Experimental results on KuaiRec and MIND datasets demonstrate that our
proposed methods achieve superior results compared to baseline approaches.
- Abstract(参考訳): データサブサンプリングは大規模レコメンデーションシステムのトレーニングを高速化するために広く使われている。
ほとんどのサブサンプリング手法はモデルベースであり、サンプル硬度などのデータ重要度を測定するために事前訓練されたパイロットモデルを必要とする。
しかし、パイロットモデルが不特定である場合、モデルベースのサブサンプリング手法は劣化する。
実際のレコメンデーションシステムではモデル誤特定が持続するので、グラフで表される入力データ構造のみを探索することで、モデル非依存なデータサブサンプリング手法を提案する。
具体的には,ユーザ-テムグラフのトポロジを調査し,ユーザ-テムグラフ間の相互作用(ユーザ-テムグラフのエッジ)の重要度をグラフコンダクタンスにより推定し,続いてネットワーク上の伝搬ステップにより推定された重要度を緩和する。
提案手法はモデル非依存であるため,モデル非依存とモデルベースの両方のサブサンプリング手法の利点を活かすことができる。
経験的に、この2つの組み合わせは、使用済みデータセット上のどのメソッドよりも一貫して改善されていることを示す。
KuaiRec と MIND のデータセットによる実験結果から,提案手法はベースライン手法よりも優れた結果が得られることが示された。
関連論文リスト
- A Federated Data Fusion-Based Prognostic Model for Applications with Multi-Stream Incomplete Signals [1.2277343096128712]
本稿では、複数のユーザが共同で障害時間予測モデルを構築することができるフェデレーション予測モデルを提案する。
数値解析により,提案モデルの性能は古典的非フェデレーション予測モデルと同一であることが示唆された。
論文 参考訳(メタデータ) (2023-11-13T17:08:34Z) - Dual Student Networks for Data-Free Model Stealing [79.67498803845059]
主な課題は、パラメータにアクセスせずにターゲットモデルの勾配を推定し、多様なトレーニングサンプルを生成することである。
そこで本研究では,2人の学生が左右対称に学習し,学生が反対するサンプルを生成するための基準を提案する。
我々の新しい最適化フレームワークは、目標モデルのより正確な勾配推定と、ベンチマーク分類データセットの精度向上を提供する。
論文 参考訳(メタデータ) (2023-09-18T18:11:31Z) - Challenging the Myth of Graph Collaborative Filtering: a Reasoned and Reproducibility-driven Analysis [50.972595036856035]
本稿では,6つの人気グラフと最近のグラフ推薦モデルの結果を再現するコードを提案する。
これらのグラフモデルと従来の協調フィルタリングモデルを比較する。
ユーザの近所からの情報フローを調べることにより,データセット構造における内在的特徴にどのようなモデルが影響するかを同定することを目的とする。
論文 参考訳(メタデータ) (2023-08-01T09:31:44Z) - MissDiff: Training Diffusion Models on Tabular Data with Missing Values [29.894691645801597]
この研究は、欠落した値を持つデータから学習するための統一的で原則化された拡散ベースのフレームワークを示す。
まず、広く採用されている「インプット・ザ・ジェネレーション」パイプラインが、バイアスのある学習目標に繋がる可能性があることを観察する。
提案手法は,データ分布のスコアの学習に一貫性があることを証明し,提案手法は特定の場合において負の確率の上限として機能する。
論文 参考訳(メタデータ) (2023-07-02T03:49:47Z) - Universal Domain Adaptation from Foundation Models: A Baseline Study [58.51162198585434]
基礎モデルを用いた最先端UniDA手法の実証的研究を行った。
CLIPモデルからターゲット知識を抽出するためのパラメータフリーな手法であるtextitCLIP 蒸留を導入する。
単純な手法ではあるが、ほとんどのベンチマークタスクでは従来の手法よりも優れている。
論文 参考訳(メタデータ) (2023-05-18T16:28:29Z) - Deep Explainable Learning with Graph Based Data Assessing and Rule
Reasoning [4.369058206183195]
本稿では、ノイズハンドリングにおけるディープモデルの利点とエキスパートルールに基づく解釈可能性を組み合わせたエンドツーエンドのディープ・ツー・エンドのディープ・説明可能な学習手法を提案する。
提案手法は, 工業生産システムにおいて, 予測精度に匹敵し, より高い一般化安定性, より優れた解釈可能性を示す。
論文 参考訳(メタデータ) (2022-11-09T05:58:56Z) - Model-free Subsampling Method Based on Uniform Designs [5.661822729320697]
我々は,既存の一様設計に基づく低GEFDデータ駆動サブサンプリング手法を開発した。
我々の手法は様々なモデル仕様の下で頑健であり、他の一般的なサブサンプリング手法は性能が低い。
論文 参考訳(メタデータ) (2022-09-08T07:47:56Z) - Distilling Interpretable Models into Human-Readable Code [71.11328360614479]
人間可読性は機械学習モデル解釈可能性にとって重要で望ましい標準である。
従来の方法を用いて解釈可能なモデルを訓練し,それを簡潔で可読なコードに抽出する。
本稿では,幅広いユースケースで効率的に,確実に高品質な結果を生成する分別線形曲線フィッティングアルゴリズムについて述べる。
論文 参考訳(メタデータ) (2021-01-21T01:46:36Z) - A Bayesian Approach with Type-2 Student-tMembership Function for T-S
Model Identification [47.25472624305589]
2型ファジィセットに基づくファジィック回帰クラスタリングは,非スパースデータに対して顕著な結果を示した。
ファジック回帰モデルのための革新的アーキテクチャを示し、スパースデータモデリングのために設計された新しい学生分布に基づく会員関数を提案する。
論文 参考訳(メタデータ) (2020-09-02T05:10:13Z) - S^3-Rec: Self-Supervised Learning for Sequential Recommendation with
Mutual Information Maximization [104.87483578308526]
本稿では,シーケンスレコメンデーションのための自己改善学習のためのモデルS3-Recを提案する。
そこで本稿では,属性,項目,サブシーケンス,シーケンス間の相関関係を学習するために,4つの補助的自己教師対象を考案する。
6つの実世界のデータセットで実施された大規模な実験は、既存の最先端手法よりも提案手法が優れていることを示す。
論文 参考訳(メタデータ) (2020-08-18T11:44:10Z) - Evaluating the Disentanglement of Deep Generative Models through
Manifold Topology [66.06153115971732]
本稿では,生成モデルのみを用いた乱れの定量化手法を提案する。
複数のデータセットにまたがるいくつかの最先端モデルを実証的に評価する。
論文 参考訳(メタデータ) (2020-06-05T20:54:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。