論文の概要: kNN-Embed: Locally Smoothed Embedding Mixtures For Multi-interest
Candidate Retrieval
- arxiv url: http://arxiv.org/abs/2205.06205v1
- Date: Thu, 12 May 2022 16:42:24 GMT
- ステータス: 処理完了
- システム内更新日: 2022-05-13 14:15:45.313983
- Title: kNN-Embed: Locally Smoothed Embedding Mixtures For Multi-interest
Candidate Retrieval
- Title(参考訳): kNN-Embed:多目的候補検索のためのローカルな平滑な埋め込みミックス
- Authors: Ahmed El-Kishky, Thomas Markovich, Kenny Leung, Frank Portman, Aria
Haghighi
- Abstract要約: kNN-Embedは、各ユーザを、学習したアイテムクラスタ上のスムーズなミックスとして表現する。
我々は、kNN-Embedを標準のANN候補検索と比較し、全体的なリコールの改善と3つのデータセット間の多様性の向上を示す。
- 参考スコア(独自算出の注目度): 6.593089179267413
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Candidate generation is the first stage in recommendation systems, where a
light-weight system is used to retrieve potentially relevant items for an input
user. These candidate items are then ranked and pruned in later stages of
recommender systems using a more complex ranking model. Since candidate
generation is the top of the recommendation funnel, it is important to retrieve
a high-recall candidate set to feed into downstream ranking models. A common
approach for candidate generation is to leverage approximate nearest neighbor
(ANN) search from a single dense query embedding; however, this approach this
can yield a low-diversity result set with many near duplicates. As users often
have multiple interests, candidate retrieval should ideally return a diverse
set of candidates reflective of the user's multiple interests. To this end, we
introduce kNN-Embed, a general approach to improving diversity in dense
ANN-based retrieval. kNN-Embed represents each user as a smoothed mixture over
learned item clusters that represent distinct `interests' of the user. By
querying each of a user's mixture component in proportion to their mixture
weights, we retrieve a high-diversity set of candidates reflecting elements
from each of a user's interests. We experimentally compare kNN-Embed to
standard ANN candidate retrieval, and show significant improvements in overall
recall and improved diversity across three datasets. Accompanying this work, we
open source a large Twitter follow-graph dataset, to spur further research in
graph-mining and representation learning for recommender systems.
- Abstract(参考訳): 候補生成はレコメンデーションシステムにおける第1段階であり、入力ユーザに対して潜在的に関連するアイテムを取得するために軽量システムを使用する。
これらの候補項目は、より複雑なランキングモデルを用いて、リコメンデータシステムの後半段階でランク付けされ、刈り取られる。
候補生成はレコメンデーションファンネルの最上位であるため、下流ランキングモデルにフィードするハイリコール候補セットを検索することが重要である。
候補生成の一般的なアプローチは、単一の高密度クエリ埋め込みから近い近傍(ANN)探索を活用することであるが、このアプローチは、多くの近い重複を持つ低多様性の結果をもたらす可能性がある。
ユーザが複数の関心を持つことが多いため、候補検索は、ユーザの複数の関心を反映した多様な候補セットを理想的に返すべきである。
そこで我々は,高密度ANN検索における多様性向上のための一般的なアプローチであるkNN-Embedを紹介する。
kNN-Embedは、各ユーザを学習アイテムクラスタ上のスムーズな混合として表現し、ユーザの‘関心’を区別する。
各ユーザの混合成分をそれぞれの混合重みに比例してクエリすることにより、ユーザの関心事から要素を反映する候補の多様性の高い集合を検索する。
knn-embed と標準 ann 候補検索を実験的に比較し、3 つのデータセット間の全体的なリコールとダイバーシティの改善を示す。
この作業を伴って、当社は大規模なTwitterフォローグラフデータセットをオープンソース化し、レコメンダシステムのためのグラフマイニングと表現学習のさらなる研究を促進する。
関連論文リスト
- Modeling Dynamic User Preference via Dictionary Learning for Sequential
Recommendation [133.8758914874593]
ユーザの好みのダイナミックさを捉えることは、ユーザの将来の行動を予測する上で非常に重要です。
浅いものも深いものも含む、既存のレコメンデーションアルゴリズムの多くは、このようなダイナミクスを独立してモデル化することが多い。
本稿では、ユーザのシーケンシャルな振る舞いを、ユーザ好みの潜伏した空間に埋め込むことの問題について考察する。
論文 参考訳(メタデータ) (2022-04-02T03:23:46Z) - Approximate Nearest Neighbor Search under Neural Similarity Metric for
Large-Scale Recommendation [20.42993976179691]
本稿では,任意のマッチング関数にANN探索を拡張する新しい手法を提案する。
我々の主な考えは、すべての項目から構築された類似性グラフに一致する関数で、欲張りのウォークを実行することである。
提案手法は,Taobaoのディスプレイ広告プラットフォームに完全に展開されており,広告収入の大幅な増加をもたらす。
論文 参考訳(メタデータ) (2022-02-14T07:55:57Z) - Sequential Search with Off-Policy Reinforcement Learning [48.88165680363482]
本稿では,RNN学習フレームワークとアテンションモデルからなる,スケーラブルなハイブリッド学習モデルを提案する。
新たな最適化のステップとして、1つのRNNパスに複数の短いユーザシーケンスをトレーニングバッチ内に収める。
また、マルチセッションパーソナライズされた検索ランキングにおける非政治強化学習の利用についても検討する。
論文 参考訳(メタデータ) (2022-02-01T06:52:40Z) - GIMIRec: Global Interaction Information Aware Multi-Interest Framework
for Sequential Recommendation [5.416421678129053]
本稿では,GIMIレコメンデーションのための多目的フレームワーク(Global Interaction Aware Multi-Interest Framework for Sequential Recommendation,GIMIRec)という新たなレコメンデーションモデルを提案する。
Recall、NDCG、Hit RateインジケータにおけるGIMIRecの性能は、最先端の手法よりも大幅に優れている。
論文 参考訳(メタデータ) (2021-12-16T09:12:33Z) - D2RLIR : an improved and diversified ranking function in interactive
recommendation systems based on deep reinforcement learning [0.3058685580689604]
本稿では,アクタ・クリティカルアーキテクチャを用いた深層強化学習に基づく推薦システムを提案する。
提案モデルでは,ユーザの嗜好に基づいて,多様かつ関連性の高いレコメンデーションリストを生成することができる。
論文 参考訳(メタデータ) (2021-10-28T13:11:29Z) - Exploring Dense Retrieval for Dialogue Response Selection [42.89426092886912]
本研究では,高密度検索モデルを用いて,大規模コーパスや非並列コーパスから直接適切な応答を選択する方法を提案する。
再ランク設定では、その単純さを考えると、その優位性はかなり驚きます。フルランク設定では、私たちは、そのような評価を最初に行うことを強調できます。
論文 参考訳(メタデータ) (2021-10-13T10:10:32Z) - Adaptive Sampling for Heterogeneous Rank Aggregation from Noisy Pairwise
Comparisons [85.5955376526419]
ランキングアグリゲーション問題では、各項目を比較する際に、様々な精度レベルが示される。
本稿では,ノイズのあるペアワイズ比較によってアイテムのランクを推定する,除去に基づくアクティブサンプリング戦略を提案する。
提案アルゴリズムは,商品の真のランキングを高い確率で返却できることを示す。
論文 参考訳(メタデータ) (2021-10-08T13:51:55Z) - On component interactions in two-stage recommender systems [82.38014314502861]
2段階のレコメンデータは、YouTube、LinkedIn、Pinterestなど、多くのオンラインプラットフォームで使用されている。
ランク付け器と評価器の相互作用が全体の性能に大きく影響していることが示される。
特に、Mixture-of-Expertsアプローチを用いて、アイテムプールの異なるサブセットに特化するように、ノミネータを訓練する。
論文 参考訳(メタデータ) (2021-06-28T20:53:23Z) - The Stereotyping Problem in Collaboratively Filtered Recommender Systems [77.56225819389773]
行列分解に基づく協調フィルタリングアルゴリズムは,ある種のステレオタイピングを誘導することを示す。
一般のユーザ層では、テキストセットの好みが反相関性がある場合、これらの項目は、ユーザーには推奨されない。
本稿では,各ユーザの多様な利害関係を捉えるために,代替的なモデリング修正を提案する。
論文 参考訳(メタデータ) (2021-06-23T18:37:47Z) - Sparse-Interest Network for Sequential Recommendation [78.83064567614656]
本稿では,シーケンシャルレコメンデーションのためのtextbfSparse textbfInterest textbfNEtwork(SINE)を提案する。
我々のスパース関心モジュールは、大きなコンセプトプールから各ユーザに対してスパースの概念セットを適応的に推測することができる。
SINEは最先端の手法よりも大幅に改善できる。
論文 参考訳(メタデータ) (2021-02-18T11:03:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。