論文の概要: Better Generalization with Semantic IDs: A case study in Ranking for
Recommendations
- arxiv url: http://arxiv.org/abs/2306.08121v1
- Date: Tue, 13 Jun 2023 20:34:15 GMT
- ステータス: 処理完了
- システム内更新日: 2023-06-16 22:50:28.109761
- Title: Better Generalization with Semantic IDs: A case study in Ranking for
Recommendations
- Title(参考訳): セマンティックIDによるより良い一般化:勧告のランク付けを事例として
- Authors: Anima Singh, Trung Vu, Raghunandan Keshavan, Nikhil Mehta, Xinyang Yi,
Lichan Hong, Lukasz Heldt, Li Wei, Ed Chi, Maheswaran Sathiamoorthy
- Abstract要約: RQ-VAEを用いてコンテンツ埋め込みから学習したコンパクトな離散アイテム表現であるSemantic IDを使用する。
産業規模のビデオ共有プラットフォームで使用される資源制約付きランキングモデルにおいて、アイテムIDの代替として使用する方法を示す。
- 参考スコア(独自算出の注目度): 17.909978767522226
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Training good representations for items is critical in recommender models.
Typically, an item is assigned a unique randomly generated ID, and is commonly
represented by learning an embedding corresponding to the value of the random
ID. Although widely used, this approach have limitations when the number of
items are large and items are power-law distributed -- typical characteristics
of real-world recommendation systems. This leads to the item cold-start
problem, where the model is unable to make reliable inferences for tail and
previously unseen items. Removing these ID features and their learned
embeddings altogether to combat cold-start issue severely degrades the
recommendation quality. Content-based item embeddings are more reliable, but
they are expensive to store and use, particularly for users' past item
interaction sequence. In this paper, we use Semantic IDs, a compact discrete
item representations learned from content embeddings using RQ-VAE that captures
hierarchy of concepts in items. We showcase how we use them as a replacement of
item IDs in a resource-constrained ranking model used in an industrial-scale
video sharing platform. Moreover, we show how Semantic IDs improves the
generalization ability of our system, without sacrificing top-level metrics.
- Abstract(参考訳): 推奨モデルでは、優れた表現をトレーニングすることが重要です。
通常、アイテムはユニークなランダムに生成されたIDに割り当てられ、通常、ランダムIDの値に対応する埋め込みを学習することによって表現される。
広く使われているが、現実のレコメンデーションシステムの典型的な特徴である、アイテムの数が大きく、アイテムが分散型である場合に制限がある。
これにより、モデルが尾部や以前に見つからなかった項目に対して信頼できる推論を行うことができない、アイテムのコールドスタート問題が発生する。
これらのid機能と学習した埋め込みを取り除き、コールドスタート問題に対処することで、レコメンデーションの品質が格段に低下する。
コンテンツベースのアイテム埋め込みは信頼性が高いが、特に過去のアイテムインタラクションシーケンスの保存と使用には費用がかかる。
本稿では,RQ-VAEを用いてコンテンツ埋め込みから学習したコンパクトな離散アイテム表現であるSemantic IDを用いて概念階層を抽出する。
本稿では,産業規模のビデオ共有プラットフォームで使用される資源制約付きランキングモデルにおいて,アイテムIDの代替として使用する方法を紹介する。
さらに,トップレベルのメトリクスを犠牲にすることなく,セマンティックidがシステムの一般化能力をいかに改善するかを示す。
関連論文リスト
- Ada-Retrieval: An Adaptive Multi-Round Retrieval Paradigm for Sequential
Recommendations [50.03560306423678]
本稿では,レコメンダシステムのための適応型マルチラウンド検索パラダイムであるAda-Retrievalを提案する。
Ada-Retrievalは、ユーザー表現を反復的に洗練し、全項目領域の潜在的な候補をよりよく捉えます。
論文 参考訳(メタデータ) (2024-01-12T15:26:40Z) - Text Matching Improves Sequential Recommendation by Reducing Popularity
Biases [48.272381505993366]
TASTEは、アイテムの識別子と属性を使用して、アイテムとユーザとイテムのインタラクションを言語化する。
実験の結果,TASTEはシーケンシャルレコメンデーションデータセットにおいて最先端の手法よりも優れていることがわかった。
論文 参考訳(メタデータ) (2023-08-27T07:44:33Z) - MISSRec: Pre-training and Transferring Multi-modal Interest-aware
Sequence Representation for Recommendation [61.45986275328629]
逐次レコメンデーションのためのマルチモーダル事前学習・転送学習フレームワークであるMISSRecを提案する。
ユーザ側ではトランスフォーマーベースのエンコーダデコーダモデルを設計し、コンテキストエンコーダがシーケンスレベルのマルチモーダルユーザ興味を捉えることを学習する。
候補項目側では,ユーザ適応項目表現を生成するために動的融合モジュールを採用する。
論文 参考訳(メタデータ) (2023-08-22T04:06:56Z) - Multi-task Item-attribute Graph Pre-training for Strict Cold-start Item
Recommendation [71.5871100348448]
ColdGPTは、アイテム内容からきめ細かい属性を抽出することにより、アイテム属性相関をアイテム属性グラフにモデル化する。
ColdGPTは、さまざまな利用可能なデータソース、すなわちアイテムの内容、過去の購入シーケンス、既存のアイテムのレビューテキストから、知識をアイテム属性グラフに転送する。
大規模な実験により、ColdGPTは既存のSCSレコメンデーターを大きなマージンで一貫して上回っていることが明らかとなった。
論文 参考訳(メタデータ) (2023-06-26T07:04:47Z) - Recommender Systems with Generative Retrieval [58.454606442670034]
本稿では,対象候補の識別子を自己回帰的に復号する新たな生成検索手法を提案する。
そのために、各項目のセマンティックIDとして機能するために、意味論的に意味のあるコードワードを作成します。
提案手法を用いて学習した推薦システムは,様々なデータセット上での現在のSOTAモデルよりも大幅に優れていることを示す。
論文 参考訳(メタデータ) (2023-05-08T21:48:17Z) - Using Interventions to Improve Out-of-Distribution Generalization of
Text-Matching Recommendation Systems [14.363532867533012]
ペア化アイテム関連データに基づく大規模ベース言語モデルの微調整は、一般化には非生産的である。
製品レコメンデーションタスクでは、新しいカテゴリや将来的な期間の項目を推薦する場合、ファインチューニングはベースモデルよりも精度が低い。
本稿では,モデルの関連性スコアに対するトークンの因果的影響を制限する介入ベース正規化器を提案する。
論文 参考訳(メタデータ) (2022-10-07T11:16:45Z) - Represent Items by Items: An Enhanced Representation of the Target Item
for Recommendation [37.28220632871373]
アイテムベースの協調フィルタリング(ICF)は、レコメンダシステムやオンライン広告などの産業アプリケーションで広く利用されている。
最近のモデルは、注意メカニズムやディープニューラルネットワークなどの方法を使用して、ユーザー表現とスコアリング機能をより正確に学習します。
共起項目から関連する情報を蒸留する対象項目の表現の強化を提案する。
論文 参考訳(メタデータ) (2021-04-26T11:28:28Z) - Sparse-Interest Network for Sequential Recommendation [78.83064567614656]
本稿では,シーケンシャルレコメンデーションのためのtextbfSparse textbfInterest textbfNEtwork(SINE)を提案する。
我々のスパース関心モジュールは、大きなコンセプトプールから各ユーザに対してスパースの概念セットを適応的に推測することができる。
SINEは最先端の手法よりも大幅に改善できる。
論文 参考訳(メタデータ) (2021-02-18T11:03:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。