論文の概要: Balanced Co-Clustering of Users and Items for Embedding Table Compression in Recommender Systems
- arxiv url: http://arxiv.org/abs/2604.18351v1
- Date: Mon, 20 Apr 2026 14:45:01 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-21 21:52:52.943311
- Title: Balanced Co-Clustering of Users and Items for Embedding Table Compression in Recommender Systems
- Title(参考訳): レコメンダシステムにおけるテーブル圧縮を埋め込むためのユーザとアイテムのバランスの取れた協調クラスタリング
- Authors: Runhao Jiang, Renchi Yang, Donghao Wu,
- Abstract要約: BACOは、ユーザとアイテムのグルーピングのためのユーザとイテムのインタラクションにおいて、協調的なシグナルを利用するというアイデアに基づいて構築されている。
BACOは,最大346倍の速度で,最大1.85%のリコール率で,埋め込みパラメータを75%以上削減し,最強のベースラインを超えることを示す。
- 参考スコア(独自算出の注目度): 11.506483851165656
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Recommender systems have advanced markedly over the past decade by transforming each user/item into a dense embedding vector with deep learning models. At industrial scale, embedding tables constituted by such vectors of all users/items demand a vast amount of parameters and impose heavy compute and memory overhead during training and inference, hindering model deployment under resource constraints. Existing solutions towards embedding compression either suffer from severely compromised recommendation accuracy or incur considerable computational costs. To mitigate these issues, this paper presents BACO, a fast and effective framework for compressing embedding tables. Unlike traditional ID hashing, BACO is built on the idea of exploiting collaborative signals in user-item interactions for user and item groupings, such that similar users/items share the same embeddings in the codebook. Specifically, we formulate a balanced co-clustering objective that maximizes intra-cluster connectivity while enforcing cluster-volume balance, and unify canonical graph clustering techniques into the framework through rigorous theoretical analyses. To produce effective groupings while averting codebook collapse, BACO instantiates this framework with a principled weighting scheme for users and items, an efficient label propagation solver, as well as secondary user clusters. Our extensive experiments comparing BACO against full models and 18 baselines over benchmark datasets demonstrate that BACO cuts embedding parameters by over 75% with a drop of at most 1.85% in recall, while surpassing the strongest baselines by being up to 346X faster.
- Abstract(参考訳): 過去10年間で、レコメンダシステムは、各ユーザ/イテムをディープラーニングモデルで密着した埋め込みベクタに変換することで、著しく進歩しました。
産業規模では、すべてのユーザ/イテムのこのようなベクトルで構成された埋め込みテーブルは、大量のパラメータを必要とし、トレーニングと推論中に大量の計算とメモリオーバーヘッドを課し、リソース制約下でのモデルデプロイメントを妨げる。
圧縮を埋め込むための既存の解決策は、非常に妥協された推奨精度に悩まされるか、かなりの計算コストがかかる。
これらの問題を緩和するために,組み込みテーブルを高速かつ効果的に圧縮する BACO を提案する。
従来のIDハッシュとは異なり、BACOはユーザとアイテムのグルーピングにおける協調的なシグナルを利用するという考え方に基づいている。
具体的には、クラスタ・ボリュームのバランスを保ちながらクラスタ内接続を最大化し、厳密な理論的解析により標準グラフクラスタリング技術をフレームワークに統一する、バランスの取れたクラスタリングの目的を定式化する。
BACOは、コードブックの崩壊を回避しつつ効果的なグルーピングを作成するために、ユーザとアイテムの原則的な重み付けスキーム、効率的なラベル伝搬解決器、セカンダリユーザクラスタを用いて、このフレームワークをインスタンス化する。
ベンチマークデータセットに対するBACOと18のベースラインを比較した大規模な実験は、BACOが埋め込みパラメータを75%以上削減し、最大1.85%のリコールを達成し、最大346倍高速で最強のベースラインを超えたことを示している。
関連論文リスト
- Compute Only Once: UG-Separation for Efficient Large Recommendation Models [22.291095065829968]
密接な相互作用モデルにおけるユーザ側の再利用可能な計算を可能にする新しいフレームワークであるユーザグループ分離(UG-Sep)を提案する。
UG-Sepは、オンラインユーザエクスペリエンスや商用メトリクスを低下させることなく、推論遅延を最大20%削減する。
我々はByteDanceで大規模なオフライン評価と大規模オンラインA/B実験を行っている。
論文 参考訳(メタデータ) (2026-02-11T02:53:59Z) - Online Clustering of Dueling Bandits [59.09590979404303]
本稿では、優先フィードバックに基づく協調的な意思決定を可能にするために、最初の「デュエルバンディットアルゴリズムのクラスタリング」を導入する。
本稿では,(1)ユーザ報酬関数をコンテキストベクトルの線形関数としてモデル化する線形デューリング帯域のクラスタリング(COLDB)と,(2)ニューラルネットワークを用いて複雑な非線形ユーザ報酬関数をモデル化するニューラルデューリング帯域のクラスタリング(CONDB)の2つの新しいアルゴリズムを提案する。
論文 参考訳(メタデータ) (2025-02-04T07:55:41Z) - Scalable Federated Unlearning via Isolated and Coded Sharding [76.12847512410767]
フェデレートされたアンラーニングは、クライアントレベルのデータエフェクトを削除するための有望なパラダイムとして登場した。
本稿では,分散シャーディングと符号化コンピューティングに基づく,スケーラブルなフェデレーション・アンラーニング・フレームワークを提案する。
論文 参考訳(メタデータ) (2024-01-29T08:41:45Z) - RecDCL: Dual Contrastive Learning for Recommendation [65.6236784430981]
本稿では、RecDCLという2つのコントラスト学習推薦フレームワークを提案する。
RecDCLでは、FCLの目的は、ユーザとイテムの正のペアに対する冗長なソリューションを排除することである。
BCLの目的は、表現の堅牢性を高めるために出力ベクトルにコントラスト埋め込みを生成するために利用される。
論文 参考訳(メタデータ) (2024-01-28T11:51:09Z) - End-to-end Learnable Clustering for Intent Learning in Recommendation [54.157784572994316]
我々は、アンダーラインELCRecと呼ばれる新しい意図学習手法を提案する。
振る舞い表現学習をUnderlineEnd-to-end UnderlineLearnable UnderlineClusteringフレームワークに統合する。
1億3000万ページビューの産業レコメンデーションシステムに本手法をデプロイし,有望な結果を得る。
論文 参考訳(メタデータ) (2024-01-11T15:22:55Z) - A Machine Learning-Based Framework for Clustering Residential
Electricity Load Profiles to Enhance Demand Response Programs [0.0]
実ケーススタディを通じて最適な負荷プロファイルを実現するために,機械学習に基づく新しいフレームワークを提案する。
本稿では,実ケーススタディを通じて最適な負荷プロファイルを実現するために,機械学習に基づく新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2023-10-31T11:23:26Z) - Meta Clustering Learning for Large-scale Unsupervised Person
Re-identification [124.54749810371986]
メタクラスタリング学習(MCL)と呼ばれる「大規模タスクのための小さなデータ」パラダイムを提案する。
MCLは、第1フェーズのトレーニングのためにコンピューティングを節約するためにクラスタリングを介して、未ラベルデータのサブセットを擬似ラベル付けするのみである。
提案手法は計算コストを大幅に削減すると同時に,従来よりも優れた性能を実現している。
論文 参考訳(メタデータ) (2021-11-19T04:10:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。