論文の概要: HierCat: Hierarchical Query Categorization from Weakly Supervised Data
at Facebook Marketplace
- arxiv url: http://arxiv.org/abs/2302.10527v2
- Date: Wed, 22 Feb 2023 01:20:07 GMT
- ステータス: 処理完了
- システム内更新日: 2023-02-23 12:08:45.002017
- Title: HierCat: Hierarchical Query Categorization from Weakly Supervised Data
at Facebook Marketplace
- Title(参考訳): HierCat: Facebook Marketplaceの弱監視データから階層的なクエリカテゴリ化
- Authors: Yunzhong He, Cong Zhang, Ruoyan Kong, Chaitanya Kulkarni, Qing Liu,
Ashish Gandhe, Amit Nithianandan, Arul Prakash
- Abstract要約: Facebook Marketplaceのクエリ分類システムであるHierCatを紹介する。
HierCatは、オフライン実験で一般的なメソッドよりも優れているだけでなく、NDCGの1.4%の改善をもたらすことを示す。
- 参考スコア(独自算出の注目度): 4.857043179753254
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Query categorization at customer-to-customer e-commerce platforms like
Facebook Marketplace is challenging due to the vagueness of search intent,
noise in real-world data, and imbalanced training data across languages. Its
deployment also needs to consider challenges in scalability and downstream
integration in order to translate modeling advances into better search result
relevance. In this paper we present HierCat, the query categorization system at
Facebook Marketplace. HierCat addresses these challenges by leveraging
multi-task pre-training of dual-encoder architectures with a hierarchical
inference step to effectively learn from weakly supervised training data mined
from searcher engagement. We show that HierCat not only outperforms popular
methods in offline experiments, but also leads to 1.4% improvement in NDCG and
4.3% increase in searcher engagement at Facebook Marketplace Search in online
A/B testing.
- Abstract(参考訳): facebook marketplaceのような顧客間eコマースプラットフォームのクエリ分類は、検索意図の曖昧さ、現実世界のデータにおけるノイズ、言語間の不均衡なトレーニングデータなどの理由から難しい。
そのデプロイには、モデリングの進歩をより良い検索結果に関連付けるために、スケーラビリティとダウンストリームの統合における課題も考慮する必要がある。
本稿では,Facebook Marketplaceのクエリ分類システムであるHierCatを紹介する。
hiercatは、デュアルエンコーダアーキテクチャのマルチタスク事前トレーニングと階層的推論ステップを活用することで、これらの課題に対処する。
hiercatはオフライン実験で一般的な手法を上回るだけでなく、ndcgでは1.4%、facebook marketplace searchでは4.3%、オンラインa/bテストでは4.3%も改善している。
関連論文リスト
- SocialPET: Socially Informed Pattern Exploiting Training for Few-Shot
Stance Detection in Social Media [8.556183465416156]
スタンス検出とは、ソーシャルメディア投稿の目的に対する視点を「好み」や「アゲインスト」として判断するタスクである。
SocialPETは、そのタスクに言語モデルを活用するための社会的に情報を得たアプローチである。
マルチターゲットとPスタンスという2つのスタンスデータセットに対するSocialPETの有効性を実証する。
論文 参考訳(メタデータ) (2024-03-08T11:00:09Z) - Contrastive Transformer Learning with Proximity Data Generation for
Text-Based Person Search [60.626459715780605]
記述的なテキストクエリーを与えられたテキストベースの人物検索は、画像ギャラリーからベストマッチした人物を検索することを目的としている。
このようなクロスモーダル検索タスクは、重要なモダリティギャップ、きめ細かい相違、注釈付きデータの不十分さのため、かなり難しい。
本稿では,テキストに基づく人物検索のための2つのトランスフォーマーモデルを提案する。
論文 参考訳(メタデータ) (2023-11-15T16:26:49Z) - QUERT: Continual Pre-training of Language Model for Query Understanding
in Travel Domain Search [15.026682829320261]
旅行ドメイン探索におけるQUERy理解のための継続事前学習型言語モデルQUERTを提案する。
Quertは、旅行ドメイン検索におけるクエリの特徴に対して、4つの調整済み事前訓練タスクで共同で訓練されている。
オンラインビジネスにおけるQUERTの改善を確認するため、QUERTをデプロイし、Fliggy APP上でA/Bテストを実施します。
論文 参考訳(メタデータ) (2023-06-11T15:39:59Z) - Noise-Robust Dense Retrieval via Contrastive Alignment Post Training [89.29256833403167]
Contrastive Alignment POst Training (CAPOT) は、指数再生を必要とせず、モデルロバスト性を改善する高効率な微調整法である。
CAPOTはドキュメントエンコーダを凍結することで堅牢な検索を可能にし、クエリエンコーダはノイズの多いクエリを修正されていないルートに整列させる。
MSMARCO、Natural Questions、Trivia QAパス検索のCAPOTノイズ変動を評価し、CAPOTがオーバーヘッドを伴わないデータ増大に類似した影響があることを発見した。
論文 参考訳(メタデータ) (2023-04-06T22:16:53Z) - Que2Engage: Embedding-based Retrieval for Relevant and Engaging Products
at Facebook Marketplace [15.054431410052851]
Que2Engageは、エンドツーエンド最適化のための検索とランキングのギャップを埋めるために構築された検索用EBRシステムである。
提案手法の有効性を,マルチタスク評価フレームワークと徹底的なベースライン比較およびアブレーション研究を通じて示す。
論文 参考訳(メタデータ) (2023-02-21T23:10:16Z) - piRank: A Probabilistic Intent Based Ranking Framework for Facebook
Search [0.07614628596146598]
本稿では,異なるクエリインテントに対する様々なランキング問題に対処するために,確率的意図に基づくランキングフレームワーク(piRank の略)を提案する。
我々は、Facebookの検索エンジンシステム上での広範な実験と研究を行い、この新しいランキングアーキテクチャの有効性を検証した。
論文 参考訳(メタデータ) (2022-03-27T18:12:56Z) - Adversarial Retriever-Ranker for dense text retrieval [51.87158529880056]
本稿では、二重エンコーダレトリバーとクロスエンコーダローダからなるAdversarial Retriever-Ranker(AR2)を提案する。
AR2は、既存の高密度レトリバー法より一貫して大幅に優れている。
これには、R@5から77.9%(+2.1%)、TriviaQA R@5から78.2%(+1.4)、MS-MARCO MRR@10から39.5%(+1.3%)の改善が含まれている。
論文 参考訳(メタデータ) (2021-10-07T16:41:15Z) - Learning from Multiple Noisy Augmented Data Sets for Better
Cross-Lingual Spoken Language Understanding [69.40915115518523]
トレーニングデータの欠如は、低リソース言語への音声言語理解(SLU)をスケールアウトする上で大きな課題となる。
低リソースターゲット言語でのトレーニングデータを合成するために、様々なデータ拡張手法が提案されている。
本稿では,拡張データにおけるノイズの軽減に焦点をあてる。
論文 参考訳(メタデータ) (2021-09-03T15:44:15Z) - Facebook AI's WMT20 News Translation Task Submission [69.92594751788403]
本稿では、Facebook AIによるWMT20共有ニュース翻訳タスクの提出について述べる。
資源設定の低さに着目し,タミル語-英語とイヌクティトゥット語-英語の2つの言語ペアに参加する。
我々は、利用可能なデータをすべて活用し、ターゲットのニュースドメインにシステムを適用するという、2つの主要な戦略を用いて、低リソース問題にアプローチする。
論文 参考訳(メタデータ) (2020-11-16T21:49:00Z) - Mining Implicit Relevance Feedback from User Behavior for Web Question
Answering [92.45607094299181]
本研究は,ユーザ行動と通過関連性との関連性を検討するための最初の研究である。
提案手法は,追加のラベル付きデータを使わずにパスランキングの精度を大幅に向上させる。
実際にこの研究は、グローバルな商用検索エンジンにおけるQAサービスの人為的ラベリングコストを大幅に削減する効果が証明されている。
論文 参考訳(メタデータ) (2020-06-13T07:02:08Z) - Complaint-driven Training Data Debugging for Query 2.0 [19.755285494278983]
苦情駆動型トレーニングデータデバッグシステムであるRainを提案する。
Rainでは、クエリの中間出力または最終出力に関する苦情を指定できる。
本稿では、線形再学習ステップを必要とする影響関数に基づく2つの新しいアプローチを提案する。
論文 参考訳(メタデータ) (2020-04-12T23:56:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。