論文の概要: GraphHash: Graph Clustering Enables Parameter Efficiency in Recommender Systems
- arxiv url: http://arxiv.org/abs/2412.17245v1
- Date: Mon, 23 Dec 2024 03:37:58 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-12-24 15:55:23.186351
- Title: GraphHash: Graph Clustering Enables Parameter Efficiency in Recommender Systems
- Title(参考訳): GraphHash: Recommenderシステムにおけるグラフクラスタリングによるパラメータ効率の実現
- Authors: Xinyi Wu, Donald Loveland, Runjin Chen, Yozen Liu, Xin Chen, Leonardo Neves, Ali Jadbabaie, Clark Mingxuan Ju, Neil Shah, Tong Zhao,
- Abstract要約: 本稿では,モジュール性に基づく二部グラフクラスタリングを利用したグラフベースの最初のアプローチであるGraphHashを紹介する。
GraphHashは検索およびクリックスルーレート予測タスクにおいて,多様なハッシュベースラインを大幅に上回ることを示す。
特にGraphHashは、埋め込みテーブルのサイズを75%以上削減する際のリコールにおいて、平均101.52%の改善を実現している。
- 参考スコア(独自算出の注目度): 51.64666652517944
- License:
- Abstract: Deep recommender systems rely heavily on large embedding tables to handle high-cardinality categorical features such as user/item identifiers, and face significant memory constraints at scale. To tackle this challenge, hashing techniques are often employed to map multiple entities to the same embedding and thus reduce the size of the embedding tables. Concurrently, graph-based collaborative signals have emerged as powerful tools in recommender systems, yet their potential for optimizing embedding table reduction remains unexplored. This paper introduces GraphHash, the first graph-based approach that leverages modularity-based bipartite graph clustering on user-item interaction graphs to reduce embedding table sizes. We demonstrate that the modularity objective has a theoretical connection to message-passing, which provides a foundation for our method. By employing fast clustering algorithms, GraphHash serves as a computationally efficient proxy for message-passing during preprocessing and a plug-and-play graph-based alternative to traditional ID hashing. Extensive experiments show that GraphHash substantially outperforms diverse hashing baselines on both retrieval and click-through-rate prediction tasks. In particular, GraphHash achieves on average a 101.52% improvement in recall when reducing the embedding table size by more than 75%, highlighting the value of graph-based collaborative information for model reduction.
- Abstract(参考訳): ディープレコメンデータシステムは、ユーザ/イテム識別子のような高次のカテゴリ機能を扱うために大きな埋め込みテーブルに大きく依存しており、大規模なメモリ制限に直面している。
この課題に対処するために、複数のエンティティを同じ埋め込みにマッピングし、そのため埋め込みテーブルのサイズを減らすために、ハッシュ技術がよく用いられる。
グラフベースの協調信号は、レコメンデータシステムにおいて強力なツールとして登場したが、埋め込みテーブルの削減を最適化する可能性はまだ明らかではない。
本稿では,ユーザ-itemインタラクショングラフ上でのモジュラリティに基づく二部グラフクラスタリングを活用して,埋め込みテーブルのサイズを削減したグラフベースの最初のアプローチであるGraphHashを紹介する。
モジュラリティの目的がメッセージパッシングに理論的に結びついていることが,本手法の基盤となることを実証する。
高速クラスタリングアルゴリズムを使用することで、GraphHashはプリプロセッシング中のメッセージパッシングの計算効率のよいプロキシとして機能し、従来のIDハッシュに代わるグラフベースのプラグインとして機能する。
大規模な実験によると、GraphHashは検索とクリックスルーレート予測の両方において、多様なハッシュベースラインを大幅に上回っている。
特にGraphHashは、埋め込みテーブルのサイズを75%以上削減する際のリコールにおける平均101.52%の改善を実現し、グラフベースのコラボレーティブ情報の価値を強調している。
関連論文リスト
- Careful Selection and Thoughtful Discarding: Graph Explicit Pooling
Utilizing Discarded Nodes [53.08068729187698]
本稿では,ノードと最終表現ベクトルの関係を明示的に活用してノードを選択するグラフ明示プール法を提案する。
提案手法の有効性を検証するため,12種類の広く使用されているデータセットを対象とした総合的な実験を行った。
論文 参考訳(メタデータ) (2023-11-21T14:44:51Z) - Redundancy-Free Self-Supervised Relational Learning for Graph Clustering [13.176413653235311]
冗長フリーグラフクラスタリング(R$2$FGC)という,自己教師付き深層グラフクラスタリング手法を提案する。
オートエンコーダとグラフオートエンコーダに基づいて,グローバルビューとローカルビューの両方から属性レベルと構造レベルの関係情報を抽出する。
この実験は,R$2$FGCが最先端のベースラインよりも優れていることを示すために,広く使用されているベンチマークデータセット上で実施されている。
論文 参考訳(メタデータ) (2023-09-09T06:18:50Z) - EGRC-Net: Embedding-induced Graph Refinement Clustering Network [66.44293190793294]
埋め込みによるグラフリファインメントクラスタリングネットワーク (EGRC-Net) という新しいグラフクラスタリングネットワークを提案する。
EGRC-Netは学習した埋め込みを利用して初期グラフを適応的に洗練し、クラスタリング性能を向上させる。
提案手法はいくつかの最先端手法より一貫して優れている。
論文 参考訳(メタデータ) (2022-11-19T09:08:43Z) - Learning Optimal Graph Filters for Clustering of Attributed Graphs [20.810096547938166]
多くの現実世界のシステムは、システム内の異なるエンティティがノードによって表現され、エッジによって相互作用するグラフとして表現することができる。
グラフィカルな構造を持つ大規模なデータセットを研究する上で重要なタスクはグラフクラスタリングである。
本稿では,FIR(Finite Impulse Response)およびARMA(Autoregressive moving Average)グラフフィルタのパラメータをクラスタリングに最適化したグラフ信号処理手法を提案する。
論文 参考訳(メタデータ) (2022-11-09T01:49:23Z) - Graph Pooling with Maximum-Weight $k$-Independent Sets [12.251091325930837]
最大ウェイト$k$非依存集合のグラフ理論的概念に基づくグラフ粗化機構を導入する。
我々は、経路長の歪み境界の理論的保証と、粗化グラフにおける重要な位相特性を保存できることを証明した。
論文 参考訳(メタデータ) (2022-08-06T14:12:47Z) - DOTIN: Dropping Task-Irrelevant Nodes for GNNs [119.17997089267124]
最近のグラフ学習アプローチでは、学習のためのグラフのサイズを減らすためのプール戦略が導入されている。
我々はDOTIN(underlineDrunderlineopping underlineTask-underlineIrrelevant underlineNodes)と呼ばれる新しいアプローチを設計し、グラフのサイズを減らす。
本手法は,グラフ分類やグラフ編集距離を含むグラフレベルのタスクにおいて,GATを約50%高速化する。
論文 参考訳(メタデータ) (2022-04-28T12:00:39Z) - Edge but not Least: Cross-View Graph Pooling [76.71497833616024]
本稿では,重要なグラフ構造情報を活用するために,クロスビューグラフプーリング(Co-Pooling)手法を提案する。
クロスビュー相互作用、エッジビュープーリング、ノードビュープーリングにより、相互にシームレスに強化され、より情報的なグラフレベルの表現が学習される。
論文 参考訳(メタデータ) (2021-09-24T08:01:23Z) - Effective and Efficient Graph Learning for Multi-view Clustering [173.8313827799077]
マルチビュークラスタリングのための効率的かつ効率的なグラフ学習モデルを提案する。
本手法はテンソルシャッテンp-ノルムの最小化により異なるビューのグラフ間のビュー類似性を利用する。
提案アルゴリズムは時間経済であり,安定した結果を得るとともに,データサイズによく対応している。
論文 参考訳(メタデータ) (2021-08-15T13:14:28Z) - Structure-Aware Hierarchical Graph Pooling using Information Bottleneck [2.7088996845250897]
グラフプーリングは、グラフ分類および回帰タスクにおけるグラフニューラルネットワーク(GNN)の重要な要素です。
本稿では,情報ボトルネック(IB)の原理を応用した,HIBPoolという新しいプール手法を提案する。
また,グラフの局所部分グラフ構造をキャプチャするために,新しい構造認識型識別プーリング読み出し(dip-readout)関数を導入する。
論文 参考訳(メタデータ) (2021-04-27T07:27:43Z) - Accurate Learning of Graph Representations with Graph Multiset Pooling [45.72542969364438]
本稿では,その構造的依存関係に応じてノード間の相互作用をキャプチャするグラフマルチセットトランス (GMT) を提案する。
実験の結果,GMTはグラフ分類ベンチマークにおいて,最先端のグラフプーリング法を著しく上回っていることがわかった。
論文 参考訳(メタデータ) (2021-02-23T07:45:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。