論文の概要: Efficient Learning of Sparse Representations from Interactions
- arxiv url: http://arxiv.org/abs/2602.09935v1
- Date: Tue, 10 Feb 2026 16:09:58 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-11 20:17:43.674022
- Title: Efficient Learning of Sparse Representations from Interactions
- Title(参考訳): 相互作用からのスパース表現の効率的な学習
- Authors: Vojtěch Vančura, Martin Spišák, Rodrigo Alves, Ladislav Peška,
- Abstract要約: 従来の密集層の代わりに高次元スパース埋め込み層を学習するためのトレーニング戦略を提案する。
製品グレードの協調フィルタリングオートエンコーダELSAを改良し,推奨精度を損なうことなく,最大10倍の埋め込みサイズを実現した。
- 参考スコア(独自算出の注目度): 9.381985901356922
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Behavioral patterns captured in embeddings learned from interaction data are pivotal across various stages of production recommender systems. However, in the initial retrieval stage, practitioners face an inherent tradeoff between embedding expressiveness and the scalability and latency of serving components, resulting in the need for representations that are both compact and expressive. To address this challenge, we propose a training strategy for learning high-dimensional sparse embedding layers in place of conventional dense ones, balancing efficiency, representational expressiveness, and interpretability. To demonstrate our approach, we modified the production-grade collaborative filtering autoencoder ELSA, achieving up to 10x reduction in embedding size with no loss of recommendation accuracy, and up to 100x reduction with only a 2.5% loss. Moreover, the active embedding dimensions reveal an interpretable inverted-index structure that segments items in a way directly aligned with the model's latent space, thereby enabling integration of segment-level recommendation functionality (e.g., 2D homepage layouts) within the candidate retrieval model itself. Source codes, additional results, as well as a live demo are available at https://github.com/zombak79/compressed_elsa
- Abstract(参考訳): インタラクションデータから学習した埋め込みでキャプチャされた行動パターンは、プロダクションレコメンデータシステムのさまざまな段階において重要である。
しかし、最初の検索段階では、実践者は、埋め込み表現性とサービスコンポーネントのスケーラビリティとレイテンシーの間に固有のトレードオフに直面し、コンパクトで表現力のある表現が必要である。
この課題に対処するために,従来の密集層の代わりに高次元のスパース埋め込み層を学習し,効率性,表現表現性,解釈可能性のバランスをとるためのトレーニング戦略を提案する。
提案手法を実証するために,製品レベルの協調フィルタリングオートエンコーダELSAを改良し,推奨精度を損なわずに最大10倍の埋め込みサイズを実現し,最大100倍の削減を実現し,損失は2.5%に留まった。
さらに、アクティブな埋め込み次元は、モデルの潜在空間と直接一致した方法でアイテムを分割する解釈可能な逆インデックス構造を示し、候補検索モデル自体にセグメントレベルのレコメンデーション機能(例えば2Dホームページレイアウト)を統合することができる。
ソースコード、追加の結果、ライブデモはhttps://github.com/zombak79/compressed_elsaで公開されている。
関連論文リスト
- Knowledge-Informed Neural Network for Complex-Valued SAR Image Recognition [51.03674130115878]
本稿では,新しい「圧縮集約圧縮」アーキテクチャ上に構築された軽量なフレームワークであるKnowledge-Informed Neural Network(KINN)を紹介する。
KINNはパラメータ効率の認識における最先端を確立し、データスカースとアウト・オブ・ディストリビューションのシナリオにおいて例外的な一般化を提供する。
論文 参考訳(メタデータ) (2025-10-23T07:12:26Z) - SMEC: Rethinking Matryoshka Representation Learning for Retrieval Embedding Compression [15.655201854308396]
SMEC(Sequential Matryoshka Embedding Compression)という新しいトレーニングフレームワークを提案する。
本フレームワークでは、トレーニング中の勾配分散を緩和するSMRL法、次元プルーニング時の情報劣化を低減するAdaptive Dimension Selection(ADS)モジュール、高次元と低次元の埋め込み間の教師なし学習を強化するSelectable Cross-Batch Memory(S-XBM)モジュールを導入している。
画像、テキスト、マルチモーダルデータセットに関する実験は、SMECが性能を維持しながら大きな次元削減を達成することを示した。
論文 参考訳(メタデータ) (2025-10-14T13:04:22Z) - USDRL: Unified Skeleton-Based Dense Representation Learning with Multi-Grained Feature Decorrelation [24.90512145836643]
本稿では,特徴デコレーションに基づく統一骨格に基づくDense Representation Learningフレームワークを提案する。
我々のアプローチは現在のSOTA(State-of-the-art)アプローチよりも大幅に優れています。
論文 参考訳(メタデータ) (2024-12-12T12:20:27Z) - Anti-Collapse Loss for Deep Metric Learning Based on Coding Rate Metric [99.19559537966538]
DMLは、分類、クラスタリング、検索といった下流タスクのための識別可能な高次元埋め込み空間を学習することを目的としている。
埋め込み空間の構造を維持し,特徴の崩壊を避けるために,反崩壊損失と呼ばれる新しい損失関数を提案する。
ベンチマークデータセットの総合実験により,提案手法が既存の最先端手法より優れていることを示す。
論文 参考訳(メタデータ) (2024-07-03T13:44:20Z) - Dual-scale Enhanced and Cross-generative Consistency Learning for Semi-supervised Medical Image Segmentation [49.57907601086494]
医用画像のセグメンテーションはコンピュータ支援診断において重要な役割を担っている。
半教師型医用画像(DEC-Seg)のための新しいDual-scale Enhanced and Cross-generative consistency learning frameworkを提案する。
論文 参考訳(メタデータ) (2023-12-26T12:56:31Z) - Instance Adaptive Prototypical Contrastive Embedding for Generalized
Zero Shot Learning [11.720039414872296]
一般的なゼロショット学習は、トレーニング中に目に見えないラベルがアクセスできないと仮定して、目に見えないラベルと見えないラベルからサンプルを分類することを目的としている。
GZSLの最近の進歩は、生成ネットワークにコントラッシブラーニングベースの埋め込みを組み込むことによって、加速している。
論文 参考訳(メタデータ) (2023-09-13T14:26:03Z) - Open-vocabulary Panoptic Segmentation with Embedding Modulation [71.15502078615587]
オープン語彙のイメージセグメンテーションは、現実世界における重要な応用のために注目を集めている。
従来のクローズド・ボキャブラリ・セグメンテーション法は、新しいオブジェクトを特徴づけることができないが、最近のいくつかのオープン・ボキャブラリ試みは、満足のいく結果を得る。
オープン語彙パノプトンのための全能的でデータ効率のよいフレームワークであるOPSNetを提案する。
論文 参考訳(メタデータ) (2023-03-20T17:58:48Z) - TLDR: Twin Learning for Dimensionality Reduction [25.373435473381356]
次元性還元法は、初期空間のいくつかの性質、典型的には「近傍」の概念が保存されているような低次元空間を学習する。
本稿では,Barlow Twinsの単純な自己教師型学習フレームワークを,手動による歪みの適切なセットを定義するのが困難あるいは不可能な環境に移植する,汎用的な入力空間の次元削減手法を提案する。
論文 参考訳(メタデータ) (2021-10-18T16:46:12Z) - Adversarial Feature Augmentation and Normalization for Visual
Recognition [109.6834687220478]
最近のコンピュータビジョンの進歩は、分類モデルの一般化能力を改善するために、逆データ拡張を利用する。
本稿では,中間的特徴埋め込みにおける敵対的拡張を提唱する効率的かつ効率的な代替手法を提案する。
代表的なバックボーンネットワークを用いて,多様な視覚認識タスクにまたがる提案手法を検証する。
論文 参考訳(メタデータ) (2021-03-22T20:36:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。