論文の概要: HEARTS: Multi-task Fusion of Dense Retrieval and Non-autoregressive
Generation for Sponsored Search
- arxiv url: http://arxiv.org/abs/2209.05861v1
- Date: Tue, 13 Sep 2022 10:19:23 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-14 13:05:18.165127
- Title: HEARTS: Multi-task Fusion of Dense Retrieval and Non-autoregressive
Generation for Sponsored Search
- Title(参考訳): HEARTS:スポンサー検索のための高密度検索と非自己回帰生成のマルチタスク融合
- Authors: Bhargav Dodla, Akash Kumar Mohankumar, Amit Singh
- Abstract要約: Dense Retrieval(DR)とNLG(Natural Language Generation)の両方を実行するために共有エンコーダを共同で最適化する新しいマルチタスク融合フレームワークを提案する。
我々はHEARTSの目的を、スポンサー付き検索以外の短文検索タスクに適用し、大幅な性能向上を達成できることを示す。
- 参考スコア(独自算出の注目度): 6.231272478265158
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Matching user search queries with relevant keywords bid by advertisers in
real-time is a crucial problem in sponsored search. In the literature, two
broad set of approaches have been explored to solve this problem: (i) Dense
Retrieval (DR) - learning dense vector representations for queries and bid
keywords in a shared space, and (ii) Natural Language Generation (NLG) -
learning to directly generate bid keywords given queries. In this work, we
first conduct an empirical study of these two approaches and show that they
offer complementary benefits that are additive. In particular, a large fraction
of the keywords retrieved from NLG haven't been retrieved by DR and vice-versa.
We then show that it is possible to effectively combine the advantages of these
two approaches in one model. Specifically, we propose HEARTS: a novel
multi-task fusion framework where we jointly optimize a shared encoder to
perform both DR and non-autoregressive NLG. Through extensive experiments on
search queries from over 30+ countries spanning 20+ languages, we show that
HEARTS retrieves 40.3% more high-quality bid keywords than the baseline
approaches with the same GPU compute. We also demonstrate that inferring on a
single HEARTS model is as good as inferring on two different DR and NLG
baseline models, with 2x the compute. Further, we show that DR models trained
with the HEARTS objective are significantly better than those trained with the
standard contrastive loss functions. Finally, we show that our HEARTS objective
can be adopted to short-text retrieval tasks other than sponsored search and
achieve significant performance gains.
- Abstract(参考訳): ユーザの検索クエリと関連するキーワードの入札をリアルタイムでマッチングすることは、スポンサー付き検索において重要な問題である。
文献では、この問題を解決するために2つの幅広いアプローチが検討されている。
(i)Dense Retrieval(DR)-共有空間におけるクエリと入札キーワードの密度の高いベクトル表現を学習し、
(ii)自然言語生成(NLG)学習により,クエリの入札キーワードを直接生成する。
本研究は,まずこれらの2つのアプローチの実証的研究を行い,これらが付加的な相補的利益をもたらすことを示す。
特に、NLGから検索されたキーワードの大部分が、DRとVice-versaによって検索されていない。
そして、この2つのアプローチの利点を1つのモデルで効果的に組み合わせることができることを示した。
具体的には、DRと非自己回帰NLGの両方を実行するために共有エンコーダを共同で最適化する、新しいマルチタスク融合フレームワークであるHEARTSを提案する。
20以上の言語にまたがる30以上の国での検索クエリに関する広範な実験を通じて、HEARTSは、同じGPU計算のベースラインアプローチよりも40.3%高い品質の入札キーワードを検索することを示した。
また、1つのHEARTSモデル上での推測は、2つの異なるDRおよびNLGベースラインモデルでの推測と同等であることを示す。
さらに,HEARTS目標で訓練したDRモデルは,標準のコントラスト損失関数で訓練したDRモデルよりも有意に優れていることを示す。
最後に,提案するHEARTSの目的を,スポンサー付き検索以外の短文検索タスクに適用し,大幅な性能向上を達成できることを示す。
関連論文リスト
- Bridging Search and Recommendation in Generative Retrieval: Does One Task Help the Other? [9.215695600542249]
検索とレコメンデーションのための生成的検索は、アイテムを検索する上で有望なパラダイムである。
これらの生成システムは、様々な情報検索タスクを単一のモデルにまとめる上で重要な役割を果たす。
本稿では,このような統合されたアプローチが,IRタスクの検索・推薦においてタスク固有モデルより優れているかどうかを考察する。
論文 参考訳(メタデータ) (2024-10-22T08:49:43Z) - Learning to Rank for Multiple Retrieval-Augmented Models through Iterative Utility Maximization [21.115495457454365]
本稿では,複数検索拡張世代(RAG)エージェントを対象とした統合検索エンジンの設計について検討する。
本稿では,これらのRAGエージェントの検索結果を検索エンジンが生成し,オフラインで検索した文書の品質に関するフィードバックを収集する反復的手法を提案する。
我々は、このアプローチをオンライン環境に適応させ、リアルタイムな個別エージェントのフィードバックに基づいて、検索エンジンがその振る舞いを洗練できるようにする。
論文 参考訳(メタデータ) (2024-10-13T17:53:50Z) - ACE: A Generative Cross-Modal Retrieval Framework with Coarse-To-Fine Semantic Modeling [53.97609687516371]
我々は、エンドツーエンドのクロスモーダル検索のための先駆的なジェネリッククロスモーダル rEtrieval framework (ACE) を提案する。
ACEは、クロスモーダル検索における最先端のパフォーマンスを達成し、Recall@1の強いベースラインを平均15.27%上回る。
論文 参考訳(メタデータ) (2024-06-25T12:47:04Z) - Unified Embedding Based Personalized Retrieval in Etsy Search [0.206242362470764]
グラフ, 変換器, 項ベース埋め込みを終末に組み込んだ統合埋め込みモデルを学習することを提案する。
我々のパーソナライズされた検索モデルは、検索購入率5.58%、サイト全体のコンバージョン率2.63%によって、検索体験を著しく改善する。
論文 参考訳(メタデータ) (2023-06-07T23:24:50Z) - LEAPS: End-to-End One-Step Person Search With Learnable Proposals [50.39493100627476]
LEAPSという学習可能な提案を用いたエンドツーエンドのワンステップ人物探索手法を提案する。
スパースと学習可能な提案のセットが与えられた後、LEAPSは動的人物検索ヘッドを使用して、非最大抑圧後処理なしで直接人物検出および対応するre-id特徴生成を行う。
論文 参考訳(メタデータ) (2023-03-21T13:59:32Z) - Enriching Relation Extraction with OpenIE [70.52564277675056]
関係抽出(RE)は情報抽出(IE)のサブ分野である
本稿では,オープン情報抽出(OpenIE)の最近の取り組みがREの課題の改善にどのように役立つかを検討する。
本稿では,2つの注釈付きコーパスであるKnowledgeNetとFewRelを用いた実験により,拡張モデルの精度向上を実証した。
論文 参考訳(メタデータ) (2022-12-19T11:26:23Z) - Query Expansion Using Contextual Clue Sampling with Language Models [69.51976926838232]
本稿では,実効的なフィルタリング戦略と検索した文書の融合の組み合わせを,各文脈の生成確率に基づいて提案する。
我々の語彙マッチングに基づくアプローチは、よく確立された高密度検索モデルDPRと比較して、同様のトップ5/トップ20検索精度と上位100検索精度を実現する。
エンド・ツー・エンドのQAでは、読者モデルも我々の手法の恩恵を受けており、いくつかの競争基準に対してエクサクト・マッチのスコアが最も高い。
論文 参考訳(メタデータ) (2022-10-13T15:18:04Z) - Multi-Objective Personalized Product Retrieval in Taobao Search [27.994166796745496]
関連性, 露出性, クリック性, 購入性の4つの階層的最適化目標を持つ, 新規な多目的パーソナライズされた製品検索モデルを提案する。
MOPPRは28日間のオンラインA/Bテストで0.96%のトランザクションと1.29%のGMV改善を達成した。
2021年のDouble-11ショッピングフェスティバル以来、MOPPRは従来のMGDSPRに代わるモバイルタオバオ検索に完全に配備されている。
論文 参考訳(メタデータ) (2022-10-09T05:18:42Z) - Diversity driven Query Rewriting in Search Advertising [1.5289756643078838]
生成的検索モデルは、このようなクエリの書き直しを生成するタスクにおいて有効であることが示されている。
高品質かつ多様な書き直しを生成するフレームワークであるCLOVERを紹介します。
提案手法の有効性を,3つの主要言語にまたがる検索クエリのオフライン実験により実証的に示す。
論文 参考訳(メタデータ) (2021-06-07T17:30:45Z) - One-Shot Neural Ensemble Architecture Search by Diversity-Guided Search
Space Shrinking [97.60915598958968]
本稿では,この2つの課題に対処するワンショットニューラルアンサンブルアーキテクチャサーチ(NEAS)ソリューションを提案する。
最初の課題として,探索空間の縮小を導くために,多様性に基づく新しい指標を導入する。
第2の課題として,異なるモデル間の階層共有を効率向上のために学習する新たな探索次元を実現する。
論文 参考訳(メタデータ) (2021-04-01T16:29:49Z) - Diverse Knowledge Distillation for End-to-End Person Search [81.4926655119318]
人物検索は、画像ギャラリーから特定の人物をローカライズし識別することを目的としている。
最近の手法は2つのグループ、すなわち2段階とエンドツーエンドのアプローチに分類できる。
ボトルネックを解消するために、多様な知識蒸留を備えたシンプルで強力なエンドツーエンドネットワークを提案します。
論文 参考訳(メタデータ) (2020-12-21T09:04:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。