論文の概要: APRF-Net: Attentive Pseudo-Relevance Feedback Network for Query
Categorization
- arxiv url: http://arxiv.org/abs/2104.11384v1
- Date: Fri, 23 Apr 2021 02:34:08 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-26 13:12:46.299824
- Title: APRF-Net: Attentive Pseudo-Relevance Feedback Network for Query
Categorization
- Title(参考訳): APRF-Net:クエリ分類のための注意的擬似関連フィードバックネットワーク
- Authors: Ali Ahmadvand, Sayyed M. Zahiri, Simon Hughes, Khalifa Al Jadda, Surya
Kallumadi, and Eugene Agichtein
- Abstract要約: クエリ分類のためのレアクエリの表現を強化するために,textbfAttentive textbfPseudo textbfRelevance textbfFeedback textbfNetwork (APRF-Net) という新しいディープニューラルネットワークを提案する。
以上の結果から,APRF-Netはクエリ分類をF1@1$スコアで5.9%改善し,レアクエリでは8.2%向上した。
- 参考スコア(独自算出の注目度): 12.634704014206294
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Query categorization is an essential part of query intent understanding in
e-commerce search. A common query categorization task is to select the relevant
fine-grained product categories in a product taxonomy. For frequent queries,
rich customer behavior (e.g., click-through data) can be used to infer the
relevant product categories. However, for more rare queries, which cover a
large volume of search traffic, relying solely on customer behavior may not
suffice due to the lack of this signal. To improve categorization of rare
queries, we adapt the Pseudo-Relevance Feedback (PRF) approach to utilize the
latent knowledge embedded in semantically or lexically similar product
documents to enrich the representation of the more rare queries. To this end,
we propose a novel deep neural model named \textbf{A}ttentive \textbf{P}seudo
\textbf{R}elevance \textbf{F}eedback \textbf{Net}work (APRF-Net) to enhance the
representation of rare queries for query categorization. To demonstrate the
effectiveness of our approach, we collect search queries from a large
commercial search engine, and compare APRF-Net to state-of-the-art deep
learning models for text classification. Our results show that the APRF-Net
significantly improves query categorization by 5.9\% on $F1@1$ score over the
baselines, which increases to 8.2\% improvement for the rare (tail) queries.
The findings of this paper can be leveraged for further improvements in search
query representation and understanding.
- Abstract(参考訳): クエリ分類は、eコマース検索におけるクエリインテント理解の重要な部分である。
一般的なクエリ分類タスクは、製品分類における関連するきめ細かい製品カテゴリを選択することである。
頻繁なクエリでは、関連する製品カテゴリを推測するためにリッチな顧客行動(クリックスルーデータなど)を使用することができる。
しかし、大量の検索トラフィックをカバーするより稀なクエリでは、この信号がないため、顧客の行動のみに依存するだけでは十分ではない。
稀なクエリの分類を改善するために,Pseudo-Relevance Feedback (PRF)アプローチを適用し,意味的あるいは語彙的に類似した製品文書に埋め込まれた潜伏知識を利用して,稀なクエリの表現を強化する。
そこで本研究では,クエリ分類のためのレアクエリの表現を強化するために,新しいディープニューラルネットワークであるtextbf{A}ttentive \textbf{P}seudo \textbf{R}elevance \textbf{F}eedback \textbf{Net}work (APRF-Net)を提案する。
提案手法の有効性を示すため,大規模商用検索エンジンから検索クエリを収集し,APRF-Netと最先端のテキスト分類深層学習モデルとの比較を行った。
以上の結果から,APRF-Netはクエリ分類をF1@1$スコアで5.9\%改善し,レア(テール)クエリでは8.2\%に向上した。
本論文の知見は検索クエリの表現と理解をさらに改善するために活用できる。
関連論文リスト
- Hierarchical Query Classification in E-commerce Search [38.67034103433015]
電子商取引プラットフォームは通常、製品情報と検索データを階層構造に保存し、構造化する。
ユーザ検索クエリを同様の階層構造に効果的に分類することは,eコマースプラットフォーム上でのユーザエクスペリエンスの向上,ニュースキュレーションや学術研究において最重要である。
階層的問合せ分類の本質的な複雑さは,(1)支配的カテゴリに傾倒する顕著なクラス不均衡,(2)正確な分類を妨げる検索クエリの本質的簡潔さとあいまいさの2つの課題によって複雑化されている。
論文 参考訳(メタデータ) (2024-03-09T21:55:55Z) - Improving Content Retrievability in Search with Controllable Query
Generation [5.450798147045502]
マシンが学習した検索エンジンは高い検索可能性バイアスを持ち、クエリの大部分が同じエンティティを返す。
そこで我々はCtrlQGenを提案する。CtrlQGenは、選択したインテントナローあるいは広義のクエリを生成する方法である。
音楽,ポッドキャスト,書籍の各分野のデータセットから得られた結果から,高密度検索モデルの検索可能性バイアスを著しく低減できることがわかった。
論文 参考訳(メタデータ) (2023-03-21T07:46:57Z) - CAPSTONE: Curriculum Sampling for Dense Retrieval with Document
Expansion [68.19934563919192]
本稿では,学習中に擬似クエリを利用して,生成したクエリと実際のクエリとの関係を徐々に向上させるカリキュラムサンプリング戦略を提案する。
ドメイン内およびドメイン外両方のデータセットに対する実験結果から,本手法が従来の高密度検索モデルより優れていることが示された。
論文 参考訳(メタデータ) (2022-12-18T15:57:46Z) - Decoding a Neural Retriever's Latent Space for Query Suggestion [28.410064376447718]
本稿では,有意なクエリをその潜在表現から復号することが可能であること,また,潜在空間の正しい方向に移動すると,関連する段落を検索するクエリを復号することができることを示す。
クエリデコーダを用いて、MSMarcoのクエリ再構成の大規模な合成データセットを生成する。
このデータに基づいて、クエリー提案の適用のために擬似関連フィードバック(PRF)T5モデルを訓練する。
論文 参考訳(メタデータ) (2022-10-21T16:19:31Z) - Query Expansion Using Contextual Clue Sampling with Language Models [69.51976926838232]
本稿では,実効的なフィルタリング戦略と検索した文書の融合の組み合わせを,各文脈の生成確率に基づいて提案する。
我々の語彙マッチングに基づくアプローチは、よく確立された高密度検索モデルDPRと比較して、同様のトップ5/トップ20検索精度と上位100検索精度を実現する。
エンド・ツー・エンドのQAでは、読者モデルも我々の手法の恩恵を受けており、いくつかの競争基準に対してエクサクト・マッチのスコアが最も高い。
論文 参考訳(メタデータ) (2022-10-13T15:18:04Z) - Graph Enhanced BERT for Query Understanding [55.90334539898102]
クエリ理解は、ユーザの検索意図を探索し、ユーザが最も望まれる情報を発見できるようにする上で、重要な役割を果たす。
近年、プレトレーニング言語モデル (PLM) は様々な自然言語処理タスクを進歩させてきた。
本稿では,クエリコンテンツとクエリグラフの両方を活用可能な,グラフ強化事前学習フレームワークGE-BERTを提案する。
論文 参考訳(メタデータ) (2022-04-03T16:50:30Z) - Improving Query Representations for Dense Retrieval with Pseudo
Relevance Feedback [29.719150565643965]
本稿では,疑似関連性フィードバック(PRF)を用いて高密度検索のためのクエリ表現を改善する新しいクエリエンコーダであるANCE-PRFを提案する。
ANCE-PRF は BERT エンコーダを使用し、検索モデルである ANCE からクエリとトップ検索されたドキュメントを消費し、関連ラベルから直接クエリの埋め込みを生成する。
PRFエンコーダは、学習された注意機構でノイズを無視しながら、PRF文書から関連および補完的な情報を効果的にキャプチャする。
論文 参考訳(メタデータ) (2021-08-30T18:10:26Z) - DeepCAT: Deep Category Representation for Query Understanding in
E-commerce Search [15.041444067591007]
本稿では,問合せ理解のプロセスを強化するために,共同語分類表現を学習する深層学習モデルDeepCATを提案する。
その結果,emマイノリティクラスではdeepcatが10%改善され,最先端ラベル埋め込みモデルではemtailクエリが7.1%向上した。
論文 参考訳(メタデータ) (2021-04-23T18:04:44Z) - Session-Aware Query Auto-completion using Extreme Multi-label Ranking [61.753713147852125]
本稿では,セッション対応クエリ自動補完の新たな手法を,XMR(Multi Multi-Xtreme Ranking)問題として取り上げる。
アルゴリズムのキーステップにいくつかの修正を提案することにより、この目的のために一般的なXMRアルゴリズムを適応させる。
当社のアプローチは、セッション情報を活用しながら、自動補完システムの厳しいレイテンシ要件を満たします。
論文 参考訳(メタデータ) (2020-12-09T17:56:22Z) - Query Resolution for Conversational Search with Limited Supervision [63.131221660019776]
本稿では,双方向トランスフォーマに基づくニューラルクエリ解決モデルQuReTeCを提案する。
我々はQuReTeCが最先端モデルより優れており、また、QuReTeCのトレーニングに必要な人為的なデータ量を大幅に削減するために、我々の遠隔監視手法が有効であることを示す。
論文 参考訳(メタデータ) (2020-05-24T11:37:22Z) - Query Focused Multi-Document Summarization with Distant Supervision [88.39032981994535]
既存の作業は、クエリとテキストセグメント間の関連性を推定する検索スタイルの手法に大きく依存している。
本稿では,クエリに関連するセグメントを推定するための個別モジュールを導入した粗大なモデリングフレームワークを提案する。
我々のフレームワークは、標準QFSベンチマークにおいて、強力な比較システムよりも優れていることを実証する。
論文 参考訳(メタデータ) (2020-04-06T22:35:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。