論文の概要: OmniSearchSage: Multi-Task Multi-Entity Embeddings for Pinterest Search
- arxiv url: http://arxiv.org/abs/2404.16260v1
- Date: Thu, 25 Apr 2024 00:10:25 GMT
- ステータス: 処理完了
- システム内更新日: 2024-04-26 15:07:57.303486
- Title: OmniSearchSage: Multi-Task Multi-Entity Embeddings for Pinterest Search
- Title(参考訳): OmniSearchSage:Pinterest検索用のマルチタスクマルチエンティティ埋め込み
- Authors: Prabhat Agarwal, Minhazul Islam Sk, Nikil Pancha, Kurchi Subhra Hazra, Jiajing Xu, Chuck Rosenberg,
- Abstract要約: OmniSearchSageは、検索クエリやピン、Pinterest検索用の製品を理解するための汎用的でスケーラブルなシステムです。
私たちはピンとプロダクトの埋め込みを組み合わせた統合クエリの埋め込みを共同で学び、その結果として、$>8%の関連性、$>7%のエンゲージメント、$>5%の広告CTRが改善されました。
- 参考スコア(独自算出の注目度): 2.917688415599187
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In this paper, we present OmniSearchSage, a versatile and scalable system for understanding search queries, pins, and products for Pinterest search. We jointly learn a unified query embedding coupled with pin and product embeddings, leading to an improvement of $>8\%$ relevance, $>7\%$ engagement, and $>5\%$ ads CTR in Pinterest's production search system. The main contributors to these gains are improved content understanding, better multi-task learning, and real-time serving. We enrich our entity representations using diverse text derived from image captions from a generative LLM, historical engagement, and user-curated boards. Our multitask learning setup produces a single search query embedding in the same space as pin and product embeddings and compatible with pre-existing pin and product embeddings. We show the value of each feature through ablation studies, and show the effectiveness of a unified model compared to standalone counterparts. Finally, we share how these embeddings have been deployed across the Pinterest search stack, from retrieval to ranking, scaling to serve $300k$ requests per second at low latency. Our implementation of this work is available at https://github.com/pinterest/atg-research/tree/main/omnisearchsage.
- Abstract(参考訳): 本稿では,Pinterest検索のための検索クエリ,ピン,製品を理解する汎用的でスケーラブルなシステムであるOmniSearchSageを紹介する。
ピンとプロダクトの埋め込みを組み合わせた統合クエリ埋め込みを共同で学習し、Pinterestの製品検索システムでは、$>8\%$の関連性、$>7\%$のエンゲージメント、$>5\%$の広告CTRが改善されました。
これらの成果の主な貢献者は、コンテンツ理解の改善、マルチタスク学習の改善、リアルタイムサービスである。
画像キャプションから派生した画像キャプション,履歴エンゲージメント,ユーザキュレートボードを用いて,エンティティ表現を充実させる。
我々のマルチタスク学習装置は、ピンとプロダクトの埋め込みと同じ空間に単一の検索クエリを埋め込み、既存のピンとプロダクトの埋め込みと互換性がある。
本研究では,各特徴量の価値をアブレーション研究により示すとともに,独立系モデルと比較して統一モデルの有効性を示す。
最後に、これらの埋め込みが、検索からランキングまで、Pinterestの検索スタック全体にどのようにデプロイされたか、低レイテンシで毎秒300k$のリクエストを提供するまで、公開しています。
この作業の実装はhttps://github.com/pinterest/atg-research/tree/main/omnisearchsage.comで公開しています。
関連論文リスト
- Align before Search: Aligning Ads Image to Text for Accurate Cross-Modal
Sponsored Search [27.42717207107]
クロスモーダルスポンサー検索は、消費者が検索エンジンで自然言語クエリーによって望ましい商品を探す際に、マルチモーダル広告(ads)を表示する。
画像とテキストの両方で広告特有の情報を調整できることは、正確で柔軟なスポンサー付き検索に不可欠だ。
広告画像の細粒度部分を対応するテキストに明示的にマッピングする単純なアライメントネットワークを提案する。
論文 参考訳(メタデータ) (2023-09-28T03:43:57Z) - End-to-end Knowledge Retrieval with Multi-modal Queries [50.01264794081951]
ReMuQは、テキストと画像のクエリからコンテンツを統合することで、大規模なコーパスから知識を取得するシステムを必要とする。
本稿では,入力テキストや画像を直接処理し,関連する知識をエンドツーエンドで検索する検索モデルReViz'を提案する。
ゼロショット設定下での2つのデータセットの検索において,優れた性能を示す。
論文 参考訳(メタデータ) (2023-06-01T08:04:12Z) - DAMO-NLP at SemEval-2023 Task 2: A Unified Retrieval-augmented System
for Multilingual Named Entity Recognition [94.90258603217008]
MultiCoNER RNum2共有タスクは、細粒度でノイズの多いシナリオにおいて、多言語の名前付きエンティティ認識(NER)に取り組むことを目的としている。
MultiCoNER RNum1の以前のトップシステムは、ナレッジベースまたはガゼッタを組み込んでいる。
細粒度多言語NERのための統一検索拡張システム(U-RaNER)を提案する。
論文 参考訳(メタデータ) (2023-05-05T16:59:26Z) - Que2Engage: Embedding-based Retrieval for Relevant and Engaging Products
at Facebook Marketplace [15.054431410052851]
Que2Engageは、エンドツーエンド最適化のための検索とランキングのギャップを埋めるために構築された検索用EBRシステムである。
提案手法の有効性を,マルチタスク評価フレームワークと徹底的なベースライン比較およびアブレーション研究を通じて示す。
論文 参考訳(メタデータ) (2023-02-21T23:10:16Z) - NeuralSearchX: Serving a Multi-billion-parameter Reranker for
Multilingual Metasearch at a Low Cost [4.186775801993103]
検索結果をマージし、文章をハイライトする多目的大規模階調モデルに基づくメタサーチエンジンであるNeuralSearchXについて述べる。
我々の設計選択は、幅広い公開ベンチマークで最先端の結果に近づきながら、競争力のあるQPSを備えたよりコスト効率の高いシステムに繋がったことを示す。
論文 参考訳(メタデータ) (2022-10-26T16:36:53Z) - Searching a High-Performance Feature Extractor for Text Recognition
Network [92.12492627169108]
優れた特徴抽出器を持つための原理を探求し,ドメイン固有の検索空間を設計する。
空間は巨大で複雑な構造であるため、既存のNASアルゴリズムを適用することはできない。
本研究では,空間内を効率的に探索する2段階のアルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-09-27T03:49:04Z) - Embracing Structure in Data for Billion-Scale Semantic Product Search [14.962039276966319]
我々は、数十億の規模でダイアドニューラル埋め込みモデルを訓練し、展開するための原則的アプローチを提案する。
実世界のデータセットの自然な構造を活用することで、両方の課題に効率的に対処できることが示される。
論文 参考訳(メタデータ) (2021-10-12T16:14:13Z) - One-shot Key Information Extraction from Document with Deep Partial
Graph Matching [60.48651298832829]
ドキュメントからキー情報抽出(KIE)は、多くの産業シナリオにおいて効率、生産性、セキュリティを改善する。
KIEタスクのための既存の教師付き学習手法は、多数のラベル付きサンプルを供給し、異なる種類の文書の別々のモデルを学ぶ必要がある。
部分グラフマッチングを用いたワンショットKIEのためのディープエンド・ツー・エンド・トレーニング可能なネットワークを提案する。
論文 参考訳(メタデータ) (2021-09-26T07:45:53Z) - Grouping Search Results with Product Graphs in E-commerce Platforms [2.887393074590696]
本稿では,検索結果を複数のランクリストに分類し,より優れたユーザインテントを提供するフレームワークを提案する。
例えば「ミルク」という問合せでは、結果は「白い牛乳」、「低脂肪牛乳」、「アーモンドミルク」、「風味のある牛乳」の複数のスタックにまとめられる。
論文 参考訳(メタデータ) (2021-09-20T08:01:29Z) - Decoupled and Memory-Reinforced Networks: Towards Effective Feature
Learning for One-Step Person Search [65.51181219410763]
歩行者検出と識別サブタスクを1つのネットワークで処理するワンステップ方式を開発しました。
現在のワンステップアプローチには2つの大きな課題があります。
本稿では,これらの問題を解決するために,分離メモリ強化ネットワーク(DMRNet)を提案する。
論文 参考訳(メタデータ) (2021-02-22T06:19:45Z) - MTL-NAS: Task-Agnostic Neural Architecture Search towards
General-Purpose Multi-Task Learning [71.90902837008278]
汎用マルチタスク学習(GP-MTL)にニューラルアーキテクチャサーチ(NAS)を導入することを提案する。
異なるタスクの組み合わせに対応するため、GP-MTLネットワークを単一タスクのバックボーンに分割する。
また,探索されたアーキテクチャ間の性能ギャップを埋める単一ショット勾配に基づく探索アルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-03-31T09:49:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。