論文の概要: Diversity driven Query Rewriting in Search Advertising
- arxiv url: http://arxiv.org/abs/2106.03816v1
- Date: Mon, 7 Jun 2021 17:30:45 GMT
- ステータス: 処理完了
- システム内更新日: 2021-06-08 18:37:32.706342
- Title: Diversity driven Query Rewriting in Search Advertising
- Title(参考訳): 検索広告における多様性駆動クエリ書き換え
- Authors: Akash Kumar Mohankumar, Nikit Begwani, Amit Singh
- Abstract要約: 生成的検索モデルは、このようなクエリの書き直しを生成するタスクにおいて有効であることが示されている。
高品質かつ多様な書き直しを生成するフレームワークであるCLOVERを紹介します。
提案手法の有効性を,3つの主要言語にまたがる検索クエリのオフライン実験により実証的に示す。
- 参考スコア(独自算出の注目度): 1.5289756643078838
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Retrieving keywords (bidwords) with the same intent as query, referred to as
close variant keywords, is of prime importance for effective targeted search
advertising. For head and torso search queries, sponsored search engines use a
huge repository of same intent queries and keywords, mined ahead of time.
Online, this repository is used to rewrite the query and then lookup the
rewrite in a repository of bid keywords contributing to significant revenue.
Recently generative retrieval models have been shown to be effective at the
task of generating such query rewrites. We observe two main limitations of such
generative models. First, rewrites generated by these models exhibit low
lexical diversity, and hence the rewrites fail to retrieve relevant keywords
that have diverse linguistic variations. Second, there is a misalignment
between the training objective - the likelihood of training data, v/s what we
desire - improved quality and coverage of rewrites. In this work, we introduce
CLOVER, a framework to generate both high-quality and diverse rewrites by
optimizing for human assessment of rewrite quality using our diversity-driven
reinforcement learning algorithm. We use an evaluation model, trained to
predict human judgments, as the reward function to finetune the generation
policy. We empirically show the effectiveness of our proposed approach through
offline experiments on search queries across geographies spanning three major
languages. We also perform online A/B experiments on Bing, a large commercial
search engine, which shows (i) better user engagement with an average increase
in clicks by 12.83% accompanied with an average defect reduction by 13.97%, and
(ii) improved revenue by 21.29%.
- Abstract(参考訳): 検索キーワード(bidwords)をクェリと同じ意図で検索することは、近種キーワードと呼ばれ、効果的なターゲティング検索広告にとって重要となる。
ヘッドとトーソ検索では、スポンサー付き検索エンジンは、前もって採掘された同じインテントクエリとキーワードの巨大なリポジトリを使用する。
オンラインでは、このレポジトリはクエリの書き直しと、大きな収益に寄与する入札キーワードのレポジトリの書き直しに使用される。
近年,このような問合せの書き直し作業において,生成的検索モデルが有効であることが示されている。
このような生成モデルの2つの主な制限を観察する。
第一に、これらのモデルによって生成される書き換えは、語彙の多様性が低く、したがって、様々な言語的バリエーションを持つ関連するキーワードを取得することができない。
第2に,トレーニング目標 – トレーニングデータの可能性,私たちが望むv/s – には,品質向上と書き直しのカバレッジ向上という誤解があります。
本研究は,我々の多様性駆動型強化学習アルゴリズムを用いて,人間の書き直し品質評価を最適化し,高品質かつ多様な書き直しを生成するフレームワークであるCLOVERを紹介する。
我々は,人間の判断を予測するように訓練された評価モデルを,生成方針を微調整する報酬機能として用いる。
提案手法の有効性を3つの主要言語にまたがる検索クエリのオフライン実験により実証的に示す。
また、大規模な商用検索エンジンであるBing上でオンラインA/B実験を実施し、(i)平均クリック数が12.83%増加し、平均欠陥が13.97%減少し、(ii)収益が21.29%向上した。
関連論文リスト
- Think-then-Act: A Dual-Angle Evaluated Retrieval-Augmented Generation [3.2134014920850364]
大型言語モデル(LLM)は時相の誤りや幻覚的内容の生成といった課題に直面していることが多い。
二重角評価による検索拡張生成フレームワーク textitThink-then-Act を提案する。
論文 参考訳(メタデータ) (2024-06-18T20:51:34Z) - Generative Query Reformulation Using Ensemble Prompting, Document Fusion, and Relevance Feedback [8.661419320202787]
GenQREnsembleとGenQRFusionはゼロショット命令のパラフレーズを利用して複数のキーワードセットを生成し、検索性能を向上させる。
検索前設定ではnDCG@10で最大18%,検索後設定では9%の精度で検索効率を向上できることを示す。
論文 参考訳(メタデータ) (2024-05-27T21:03:26Z) - Adapting Dual-encoder Vision-language Models for Paraphrased Retrieval [55.90407811819347]
モデルが類似した結果を返すことを目的とした,パラフレーズ付きテキスト画像検索の課題について考察する。
我々は、大きなテキストコーパスで事前訓練された言語モデルから始まる二重エンコーダモデルを訓練する。
CLIPやOpenCLIPのような公開デュアルエンコーダモデルと比較して、最高の適応戦略で訓練されたモデルは、パラフレーズクエリのランク付けの類似性を大幅に向上させる。
論文 参考訳(メタデータ) (2024-05-06T06:30:17Z) - ExcluIR: Exclusionary Neural Information Retrieval [74.08276741093317]
本稿では,排他的検索のためのリソースセットであるExcluIRを提案する。
評価ベンチマークには3,452の高品質な排他的クエリが含まれている。
トレーニングセットには70,293の排他的クエリが含まれており、それぞれに正のドキュメントと負のドキュメントがペアリングされている。
論文 参考訳(メタデータ) (2024-04-26T09:43:40Z) - Retrieval is Accurate Generation [99.24267226311157]
本稿では,支援文書の集合からコンテキスト認識句を選択する新しい手法を提案する。
本モデルでは,検索対象のベースラインの中で,最高の性能と低レイテンシを実現する。
論文 参考訳(メタデータ) (2024-02-27T14:16:19Z) - Fine-tuning Language Models for Factuality [96.5203774943198]
大規模な事前訓練型言語モデル(LLM)は、しばしば伝統的な検索エンジンの代替として、広く使われるようになった。
しかし、言語モデルは説得力のあるが事実的に不正確な主張をしがちである(しばしば「幻覚」と呼ばれる)。
本研究では,人間のラベル付けなしに,より現実的な言語モデルを微調整する。
論文 参考訳(メタデータ) (2023-11-14T18:59:15Z) - Unified Embedding Based Personalized Retrieval in Etsy Search [0.206242362470764]
グラフ, 変換器, 項ベース埋め込みを終末に組み込んだ統合埋め込みモデルを学習することを提案する。
我々のパーソナライズされた検索モデルは、検索購入率5.58%、サイト全体のコンバージョン率2.63%によって、検索体験を著しく改善する。
論文 参考訳(メタデータ) (2023-06-07T23:24:50Z) - Enriching Relation Extraction with OpenIE [70.52564277675056]
関係抽出(RE)は情報抽出(IE)のサブ分野である
本稿では,オープン情報抽出(OpenIE)の最近の取り組みがREの課題の改善にどのように役立つかを検討する。
本稿では,2つの注釈付きコーパスであるKnowledgeNetとFewRelを用いた実験により,拡張モデルの精度向上を実証した。
論文 参考訳(メタデータ) (2022-12-19T11:26:23Z) - Query Expansion Using Contextual Clue Sampling with Language Models [69.51976926838232]
本稿では,実効的なフィルタリング戦略と検索した文書の融合の組み合わせを,各文脈の生成確率に基づいて提案する。
我々の語彙マッチングに基づくアプローチは、よく確立された高密度検索モデルDPRと比較して、同様のトップ5/トップ20検索精度と上位100検索精度を実現する。
エンド・ツー・エンドのQAでは、読者モデルも我々の手法の恩恵を受けており、いくつかの競争基準に対してエクサクト・マッチのスコアが最も高い。
論文 参考訳(メタデータ) (2022-10-13T15:18:04Z) - Unified Generative & Dense Retrieval for Query Rewriting in Sponsored
Search [6.181557214852772]
オンラインクエリ書き換えのパラダイムとして,ジェネレーティブ(NLG)とDense Retrieval(DR)の2つを比較した。
CLOVER-Unityは1つのモデルで生成的および密度の高い検索方法を統一する新しい手法である。
論文 参考訳(メタデータ) (2022-09-13T10:19:23Z) - Leveraging Cognitive Search Patterns to Enhance Automated Natural
Language Retrieval Performance [0.0]
ユーザの検索行動を模倣する認知的再構成パターンが強調されている。
問合せの概念表現を考慮し,これらのパターンの適用を形式化する。
遺伝的アルゴリズムに基づく重み付けプロセスでは、概念的役割タイプに応じて用語に重点を置くことができる。
論文 参考訳(メタデータ) (2020-04-21T14:13:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。