論文の概要: Better Generalization with Semantic IDs: A case study in Ranking for
Recommendations
- arxiv url: http://arxiv.org/abs/2306.08121v1
- Date: Tue, 13 Jun 2023 20:34:15 GMT
- ステータス: 処理完了
- システム内更新日: 2023-06-16 22:50:28.109761
- Title: Better Generalization with Semantic IDs: A case study in Ranking for
Recommendations
- Title(参考訳): セマンティックIDによるより良い一般化:勧告のランク付けを事例として
- Authors: Anima Singh, Trung Vu, Raghunandan Keshavan, Nikhil Mehta, Xinyang Yi,
Lichan Hong, Lukasz Heldt, Li Wei, Ed Chi, Maheswaran Sathiamoorthy
- Abstract要約: RQ-VAEを用いてコンテンツ埋め込みから学習したコンパクトな離散アイテム表現であるSemantic IDを使用する。
産業規模のビデオ共有プラットフォームで使用される資源制約付きランキングモデルにおいて、アイテムIDの代替として使用する方法を示す。
- 参考スコア(独自算出の注目度): 17.909978767522226
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Training good representations for items is critical in recommender models.
Typically, an item is assigned a unique randomly generated ID, and is commonly
represented by learning an embedding corresponding to the value of the random
ID. Although widely used, this approach have limitations when the number of
items are large and items are power-law distributed -- typical characteristics
of real-world recommendation systems. This leads to the item cold-start
problem, where the model is unable to make reliable inferences for tail and
previously unseen items. Removing these ID features and their learned
embeddings altogether to combat cold-start issue severely degrades the
recommendation quality. Content-based item embeddings are more reliable, but
they are expensive to store and use, particularly for users' past item
interaction sequence. In this paper, we use Semantic IDs, a compact discrete
item representations learned from content embeddings using RQ-VAE that captures
hierarchy of concepts in items. We showcase how we use them as a replacement of
item IDs in a resource-constrained ranking model used in an industrial-scale
video sharing platform. Moreover, we show how Semantic IDs improves the
generalization ability of our system, without sacrificing top-level metrics.
- Abstract(参考訳): 推奨モデルでは、優れた表現をトレーニングすることが重要です。
通常、アイテムはユニークなランダムに生成されたIDに割り当てられ、通常、ランダムIDの値に対応する埋め込みを学習することによって表現される。
広く使われているが、現実のレコメンデーションシステムの典型的な特徴である、アイテムの数が大きく、アイテムが分散型である場合に制限がある。
これにより、モデルが尾部や以前に見つからなかった項目に対して信頼できる推論を行うことができない、アイテムのコールドスタート問題が発生する。
これらのid機能と学習した埋め込みを取り除き、コールドスタート問題に対処することで、レコメンデーションの品質が格段に低下する。
コンテンツベースのアイテム埋め込みは信頼性が高いが、特に過去のアイテムインタラクションシーケンスの保存と使用には費用がかかる。
本稿では,RQ-VAEを用いてコンテンツ埋め込みから学習したコンパクトな離散アイテム表現であるSemantic IDを用いて概念階層を抽出する。
本稿では,産業規模のビデオ共有プラットフォームで使用される資源制約付きランキングモデルにおいて,アイテムIDの代替として使用する方法を紹介する。
さらに,トップレベルのメトリクスを犠牲にすることなく,セマンティックidがシステムの一般化能力をいかに改善するかを示す。
関連論文リスト
- STORE: Streamlining Semantic Tokenization and Generative Recommendation with A Single LLM [59.08493154172207]
本稿では,意味的トークン化と生成的レコメンデーションプロセスを合理化する統合フレームワークを提案する。
我々は,意味的トークン化をテキスト・ツー・ケントタスクとして定式化し,生成的推薦をトークン・ツー・ケントタスクとして,トークン・ツー・ケント・コンストラクションタスクとテキスト・ツー・ケント補助タスクで補足する。
これらのタスクはすべて生成的な方法でフレーム化され、単一の大規模言語モデル(LLM)バックボーンを使用してトレーニングされる。
論文 参考訳(メタデータ) (2024-09-11T13:49:48Z) - ASI++: Towards Distributionally Balanced End-to-End Generative Retrieval [29.65717446547002]
ASI++は、新しいエンドツーエンドの生成検索手法である。
バランスの取れたIDの割り当てを同時に学習し、検索性能を向上させることを目的としている。
論文 参考訳(メタデータ) (2024-05-23T07:54:57Z) - MMGRec: Multimodal Generative Recommendation with Transformer Model [81.61896141495144]
MMGRecは、マルチモーダルレコメンデーションに生成パラダイムを導入することを目指している。
まず,階層的な量子化手法であるGraph CF-RQVAEを考案し,各項目にRec-IDを割り当てる。
次に、Transformerベースのレコメンデータをトレーニングし、過去のインタラクションシーケンスに基づいて、ユーザが推奨するアイテムのRec-IDを生成する。
論文 参考訳(メタデータ) (2024-04-25T12:11:27Z) - Summarization-Based Document IDs for Generative Retrieval with Language Models [65.11811787587403]
要約に基づく文書IDを導入し、各文書のIDは抽出的要約または抽象的キーフレーズから構成される。
以上の結果から,ACIDの使用はトップ10とトップ20のリコールをそれぞれ15.6%,14.4%(相対)改善することがわかった。
また, 抽出IDは, MSMARCOのスニペットではなく, ウィキペディア記事の抽象IDよりも優れていた。
論文 参考訳(メタデータ) (2023-11-14T23:28:36Z) - Language Models As Semantic Indexers [78.83425357657026]
本稿では,ジェネレーティブ言語モデルを用いてセマンティックIDを学習するための自己教師型フレームワークLMIndexerを紹介する。
学習したIDの質を検証し,推奨,製品検索,文書検索の3つの課題において有効性を示す。
論文 参考訳(メタデータ) (2023-10-11T18:56:15Z) - Exploring Fine-Grained Representation and Recomposition for Cloth-Changing Person Re-Identification [78.52704557647438]
補助的なアノテーションやデータなしに両方の制約に対処するために,新しいFIne-fine Representation and Recomposition (FIRe$2$) フレームワークを提案する。
FIRe$2$は、広く使われている5つのRe-IDベンチマークで最先端のパフォーマンスを実現することができる。
論文 参考訳(メタデータ) (2023-08-21T12:59:48Z) - Recommender Systems with Generative Retrieval [58.454606442670034]
本稿では,対象候補の識別子を自己回帰的に復号する新たな生成検索手法を提案する。
そのために、各項目のセマンティックIDとして機能するために、意味論的に意味のあるコードワードを作成します。
提案手法を用いて学習した推薦システムは,様々なデータセット上での現在のSOTAモデルよりも大幅に優れていることを示す。
論文 参考訳(メタデータ) (2023-05-08T21:48:17Z) - ESA-ReID: Entropy-Based Semantic Feature Alignment for Person re-ID [7.978877859859102]
実世界の人物識別(re-ID)は、監視システムにおける典型的な応用の他に、コンテンツビデオ(テレビ・映画)における人物識別のリコール率の向上にも意義がある。
本稿では,人間の意味的特徴の詳細な情報を利用するエントロピーに基づく意味的特徴アライメントモデルを提案する。
意味的セグメンテーションの不確実性を考慮すると、エントロピーに基づくマスクとのセグメンテーションアライメントを導入することで、マスクセグメンテーションエラーの負の効果を低減することができる。
論文 参考訳(メタデータ) (2020-07-09T08:56:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。