論文の概要: kNN-Embed: Locally Smoothed Embedding Mixtures For Multi-interest
Candidate Retrieval
- arxiv url: http://arxiv.org/abs/2205.06205v3
- Date: Sat, 5 Aug 2023 19:10:12 GMT
- ステータス: 処理完了
- システム内更新日: 2023-08-09 01:17:41.856207
- Title: kNN-Embed: Locally Smoothed Embedding Mixtures For Multi-interest
Candidate Retrieval
- Title(参考訳): kNN-Embed:多目的候補検索のためのローカルな平滑な埋め込みミックス
- Authors: Ahmed El-Kishky, Thomas Markovich, Kenny Leung, Frank Portman, Aria
Haghighi, Ying Xiao
- Abstract要約: kNN-Embedは、各ユーザを、学習したアイテムクラスタ上のスムーズな混合として表現し、ユーザの“関心”を表現している。
我々は、kNN-Embedを標準のANN候補検索と比較し、全体的なリコールの改善と3つのデータセット間の多様性の向上を示す。
- 参考スコア(独自算出の注目度): 7.681386867564213
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Candidate retrieval is the first stage in recommendation systems, where a
light-weight system is used to retrieve potentially relevant items for an input
user. These candidate items are then ranked and pruned in later stages of
recommender systems using a more complex ranking model. As the top of the
recommendation funnel, it is important to retrieve a high-recall candidate set
to feed into downstream ranking models. A common approach is to leverage
approximate nearest neighbor (ANN) search from a single dense query embedding;
however, this approach this can yield a low-diversity result set with many near
duplicates. As users often have multiple interests, candidate retrieval should
ideally return a diverse set of candidates reflective of the user's multiple
interests. To this end, we introduce kNN-Embed, a general approach to improving
diversity in dense ANN-based retrieval. kNN-Embed represents each user as a
smoothed mixture over learned item clusters that represent distinct "interests"
of the user. By querying each of a user's mixture component in proportion to
their mixture weights, we retrieve a high-diversity set of candidates
reflecting elements from each of a user's interests. We experimentally compare
kNN-Embed to standard ANN candidate retrieval, and show significant
improvements in overall recall and improved diversity across three datasets.
Accompanying this work, we open source a large Twitter follow-graph dataset
(https://huggingface.co/datasets/Twitter/TwitterFollowGraph), to spur further
research in graph-mining and representation learning for recommender systems.
- Abstract(参考訳): 候補検索はレコメンデーションシステムにおける第1段階であり、軽量システムを用いて入力ユーザに対して潜在的に関連するアイテムを検索する。
これらの候補項目は、より複雑なランキングモデルを用いて、リコメンデータシステムの後半段階でランク付けされ、刈り取られる。
推薦ファンネルの最上部として、下流ランキングモデルにフィードするハイリコール候補セットを検索することが重要である。
一般的なアプローチは、1つの高密度クエリ埋め込みから近い近傍(ANN)探索を活用することであるが、このアプローチは、多くの近い重複を持つ低多様性の結果をもたらす可能性がある。
ユーザが複数の関心を持つことが多いため、候補検索は、ユーザの複数の関心を反映した多様な候補セットを理想的に返すべきである。
そこで我々は,高密度ANN検索における多様性向上のための一般的なアプローチであるkNN-Embedを紹介する。
kNN-Embedは、各ユーザを学習アイテムクラスタ上のスムーズな混合として表現し、ユーザの“関心”を区別する。
各ユーザの混合成分をそれぞれの混合重みに比例してクエリすることにより、ユーザの関心事から要素を反映する候補の多様性の高い集合を検索する。
knn-embed と標準 ann 候補検索を実験的に比較し、3 つのデータセット間の全体的なリコールとダイバーシティの改善を示す。
この作業を伴って、私たちは大規模なTwitterフォローグラフデータセット(https://huggingface.co/datasets/Twitter/TwitterFollowGraph)をオープンソース化しました。
関連論文リスト
- Ada-Retrieval: An Adaptive Multi-Round Retrieval Paradigm for Sequential
Recommendations [50.03560306423678]
本稿では,レコメンダシステムのための適応型マルチラウンド検索パラダイムであるAda-Retrievalを提案する。
Ada-Retrievalは、ユーザー表現を反復的に洗練し、全項目領域の潜在的な候補をよりよく捉えます。
論文 参考訳(メタデータ) (2024-01-12T15:26:40Z) - Revisiting Neural Retrieval on Accelerators [20.415728886298915]
検索の重要な構成要素は、(ユーザ、アイテム)類似性をモデル化することである。
その人気にもかかわらず、ドット製品は多面的であり、おそらく高いランクにある複雑なユーザとイテムのインタラクションをキャプチャすることはできない。
本稿では,基本類似度関数の適応的構成として,ユーザ,アイテムの類似度をモデル化したロジットのテキストミックス(MoL)を提案する。
論文 参考訳(メタデータ) (2023-06-06T22:08:42Z) - Recommender Systems with Generative Retrieval [58.454606442670034]
本稿では,対象候補の識別子を自己回帰的に復号する新たな生成検索手法を提案する。
そのために、各項目のセマンティックIDとして機能するために、意味論的に意味のあるコードワードを作成します。
提案手法を用いて学習した推薦システムは,様々なデータセット上での現在のSOTAモデルよりも大幅に優れていることを示す。
論文 参考訳(メタデータ) (2023-05-08T21:48:17Z) - Hierarchical Multi-Interest Co-Network For Coarse-Grained Ranking [27.00455925014862]
大規模なオンラインレコメンデーションサービスは、通常、候補生成、粗い粒度ランキング、きめ細かい粒度ランキングの3つのステージで構成されている。
これまでの研究では、ユーザーの興味は多様であり、1つのベクトルはユーザーの好みを捉えるのに十分ではないことが示されている。
本稿では,階層型多目的ネットワーク(HCN)を提案する。
論文 参考訳(メタデータ) (2022-10-19T13:40:16Z) - The Minority Matters: A Diversity-Promoting Collaborative Metric
Learning Algorithm [154.47590401735323]
CML(Collaborative Metric Learning)は、リコメンデーションシステムにおいて人気のある手法として最近登場した。
本稿では,ユーザが複数のカテゴリの関心を持つ,困難なシナリオに焦点をあてる。
textitDiversity-Promoting Collaborative Metric Learning (DPCML) と呼ばれる新しい手法を提案する。
論文 参考訳(メタデータ) (2022-09-30T08:02:18Z) - Everyone's Preference Changes Differently: Weighted Multi-Interest
Retrieval Model [18.109035867113217]
MIPモデル(Multi-Interest Preference)は、ユーザのシーケンシャルエンゲージメントをより効果的に利用することで、ユーザにとってマルチエンゲージメントを生み出すアプローチである。
本手法の有効性を実証するため,様々な産業規模のデータセットを用いて大規模な実験を行った。
論文 参考訳(メタデータ) (2022-07-14T04:29:54Z) - Modeling Dynamic User Preference via Dictionary Learning for Sequential
Recommendation [133.8758914874593]
ユーザの好みのダイナミックさを捉えることは、ユーザの将来の行動を予測する上で非常に重要です。
浅いものも深いものも含む、既存のレコメンデーションアルゴリズムの多くは、このようなダイナミクスを独立してモデル化することが多い。
本稿では、ユーザのシーケンシャルな振る舞いを、ユーザ好みの潜伏した空間に埋め込むことの問題について考察する。
論文 参考訳(メタデータ) (2022-04-02T03:23:46Z) - Sparse-Interest Network for Sequential Recommendation [78.83064567614656]
本稿では,シーケンシャルレコメンデーションのためのtextbfSparse textbfInterest textbfNEtwork(SINE)を提案する。
我々のスパース関心モジュールは、大きなコンセプトプールから各ユーザに対してスパースの概念セットを適応的に推測することができる。
SINEは最先端の手法よりも大幅に改善できる。
論文 参考訳(メタデータ) (2021-02-18T11:03:48Z) - Controllable Multi-Interest Framework for Recommendation [64.30030600415654]
我々はレコメンデータシステムを逐次レコメンデーション問題として定式化する。
我々は,ComiRec と呼ばれる連続的なレコメンデーションのための新しい制御可能な多目的フレームワークを提案する。
私たちのフレームワークは、オフラインのAlibaba分散クラウドプラットフォームにうまくデプロイされています。
論文 参考訳(メタデータ) (2020-05-19T10:18:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。