論文の概要: GraphHash: Graph Clustering Enables Parameter Efficiency in Recommender Systems
- arxiv url: http://arxiv.org/abs/2412.17245v2
- Date: Sat, 08 Feb 2025 05:54:48 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-02-11 14:23:27.641599
- Title: GraphHash: Graph Clustering Enables Parameter Efficiency in Recommender Systems
- Title(参考訳): GraphHash: Recommenderシステムにおけるグラフクラスタリングによるパラメータ効率の実現
- Authors: Xinyi Wu, Donald Loveland, Runjin Chen, Yozen Liu, Xin Chen, Leonardo Neves, Ali Jadbabaie, Clark Mingxuan Ju, Neil Shah, Tong Zhao,
- Abstract要約: 本稿では,モジュール性に基づく二部グラフクラスタリングを利用したグラフベースの最初のアプローチであるGraphHashを紹介する。
高速クラスタリングアルゴリズムを使用することで、GraphHashはプリプロセス中のメッセージパッシングの計算効率のよいプロキシとして機能する。
実験では、GraphHashは検索およびクリックスルーレート予測タスクの両方において、多様なハッシュベースラインを大幅に上回る。
- 参考スコア(独自算出の注目度): 51.64666652517944
- License:
- Abstract: Deep recommender systems rely heavily on large embedding tables to handle high-cardinality categorical features such as user/item identifiers, and face significant memory constraints at scale. To tackle this challenge, hashing techniques are often employed to map multiple entities to the same embedding and thus reduce the size of the embedding tables. Concurrently, graph-based collaborative signals have emerged as powerful tools in recommender systems, yet their potential for optimizing embedding table reduction remains unexplored. This paper introduces GraphHash, the first graph-based approach that leverages modularity-based bipartite graph clustering on user-item interaction graphs to reduce embedding table sizes. We demonstrate that the modularity objective has a theoretical connection to message-passing, which provides a foundation for our method. By employing fast clustering algorithms, GraphHash serves as a computationally efficient proxy for message-passing during preprocessing and a plug-and-play graph-based alternative to traditional ID hashing. Extensive experiments show that GraphHash substantially outperforms diverse hashing baselines on both retrieval and click-through-rate prediction tasks. In particular, GraphHash achieves on average a 101.52% improvement in recall when reducing the embedding table size by more than 75%, highlighting the value of graph-based collaborative information for model reduction. Our code is available at https://github.com/snap-research/GraphHash.
- Abstract(参考訳): ディープレコメンデータシステムは、ユーザ/イテム識別子のような高次のカテゴリ機能を扱うために大きな埋め込みテーブルに大きく依存しており、大規模なメモリ制限に直面している。
この課題に対処するために、複数のエンティティを同じ埋め込みにマッピングし、そのため埋め込みテーブルのサイズを減らすために、ハッシュ技術がよく用いられる。
グラフベースの協調信号は、レコメンデータシステムにおいて強力なツールとして登場したが、埋め込みテーブルの削減を最適化する可能性はまだ明らかではない。
本稿では,ユーザ-itemインタラクショングラフ上でのモジュラリティに基づく二部グラフクラスタリングを活用して,埋め込みテーブルのサイズを削減したグラフベースの最初のアプローチであるGraphHashを紹介する。
モジュラリティの目的がメッセージパッシングに理論的に結びついていることが,本手法の基盤となることを実証する。
高速クラスタリングアルゴリズムを使用することで、GraphHashはプリプロセッシング中のメッセージパッシングの計算効率のよいプロキシとして機能し、従来のIDハッシュに代わるグラフベースのプラグインとして機能する。
大規模な実験により、GraphHashは検索とクリックスルーレート予測の両方において、多様なハッシュベースラインを大幅に上回ることがわかった。
特にGraphHashは、埋め込みテーブルのサイズを75%以上削減する際のリコールにおける平均101.52%の改善を実現し、グラフベースのコラボレーティブ情報の価値を強調している。
私たちのコードはhttps://github.com/snap-research/GraphHash.orgから入手可能です。
関連論文リスト
- An Automatic Graph Construction Framework based on Large Language Models for Recommendation [49.51799417575638]
本稿では,大規模言語モデルに基づく自動グラフ構築フレームワークであるAutoGraphを紹介する。
LLMはユーザ好みとアイテムの知識を推論し、セマンティックベクターとして符号化する。
潜在因子は、ユーザ/イテムノードをリンクする余分なノードとして組み込まれ、結果として、深いグローバルビューセマンティクスを持つグラフとなる。
論文 参考訳(メタデータ) (2024-12-24T07:51:29Z) - Careful Selection and Thoughtful Discarding: Graph Explicit Pooling
Utilizing Discarded Nodes [53.08068729187698]
本稿では,ノードと最終表現ベクトルの関係を明示的に活用してノードを選択するグラフ明示プール法を提案する。
提案手法の有効性を検証するため,12種類の広く使用されているデータセットを対象とした総合的な実験を行った。
論文 参考訳(メタデータ) (2023-11-21T14:44:51Z) - Learning Optimal Graph Filters for Clustering of Attributed Graphs [20.810096547938166]
多くの現実世界のシステムは、システム内の異なるエンティティがノードによって表現され、エッジによって相互作用するグラフとして表現することができる。
グラフィカルな構造を持つ大規模なデータセットを研究する上で重要なタスクはグラフクラスタリングである。
本稿では,FIR(Finite Impulse Response)およびARMA(Autoregressive moving Average)グラフフィルタのパラメータをクラスタリングに最適化したグラフ信号処理手法を提案する。
論文 参考訳(メタデータ) (2022-11-09T01:49:23Z) - Dynamic Graph Message Passing Networks for Visual Recognition [112.49513303433606]
長距離依存のモデリングは、コンピュータビジョンにおけるシーン理解タスクに不可欠である。
完全連結グラフはそのようなモデリングには有益であるが、計算オーバーヘッドは禁じられている。
本稿では,計算複雑性を大幅に低減する動的グラフメッセージパッシングネットワークを提案する。
論文 参考訳(メタデータ) (2022-09-20T14:41:37Z) - Graph Pooling with Maximum-Weight $k$-Independent Sets [12.251091325930837]
最大ウェイト$k$非依存集合のグラフ理論的概念に基づくグラフ粗化機構を導入する。
我々は、経路長の歪み境界の理論的保証と、粗化グラフにおける重要な位相特性を保存できることを証明した。
論文 参考訳(メタデータ) (2022-08-06T14:12:47Z) - DOTIN: Dropping Task-Irrelevant Nodes for GNNs [119.17997089267124]
最近のグラフ学習アプローチでは、学習のためのグラフのサイズを減らすためのプール戦略が導入されている。
我々はDOTIN(underlineDrunderlineopping underlineTask-underlineIrrelevant underlineNodes)と呼ばれる新しいアプローチを設計し、グラフのサイズを減らす。
本手法は,グラフ分類やグラフ編集距離を含むグラフレベルのタスクにおいて,GATを約50%高速化する。
論文 参考訳(メタデータ) (2022-04-28T12:00:39Z) - Edge but not Least: Cross-View Graph Pooling [76.71497833616024]
本稿では,重要なグラフ構造情報を活用するために,クロスビューグラフプーリング(Co-Pooling)手法を提案する。
クロスビュー相互作用、エッジビュープーリング、ノードビュープーリングにより、相互にシームレスに強化され、より情報的なグラフレベルの表現が学習される。
論文 参考訳(メタデータ) (2021-09-24T08:01:23Z) - Accurate Learning of Graph Representations with Graph Multiset Pooling [45.72542969364438]
本稿では,その構造的依存関係に応じてノード間の相互作用をキャプチャするグラフマルチセットトランス (GMT) を提案する。
実験の結果,GMTはグラフ分類ベンチマークにおいて,最先端のグラフプーリング法を著しく上回っていることがわかった。
論文 参考訳(メタデータ) (2021-02-23T07:45:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。