論文の概要: Learning Robust Models for e-Commerce Product Search
- arxiv url: http://arxiv.org/abs/2005.03624v1
- Date: Thu, 7 May 2020 17:22:21 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-05 22:58:48.994859
- Title: Learning Robust Models for e-Commerce Product Search
- Title(参考訳): eコマース製品検索のためのロバストモデル学習
- Authors: Thanh V. Nguyen, Nikhil Rao and Karthik Subbian
- Abstract要約: 検索クエリ意図にマッチしないアイテムを表示することは、eコマースにおける顧客エクスペリエンスを低下させる。
問題を緩和するには、大きなラベル付きデータセットが必要である。
我々は、ミスマッチを効果的に分類することを学ぶ、深いエンドツーエンドモデルを開発する。
- 参考スコア(独自算出の注目度): 23.537201383165755
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Showing items that do not match search query intent degrades customer
experience in e-commerce. These mismatches result from counterfactual biases of
the ranking algorithms toward noisy behavioral signals such as clicks and
purchases in the search logs. Mitigating the problem requires a large labeled
dataset, which is expensive and time-consuming to obtain. In this paper, we
develop a deep, end-to-end model that learns to effectively classify mismatches
and to generate hard mismatched examples to improve the classifier. We train
the model end-to-end by introducing a latent variable into the cross-entropy
loss that alternates between using the real and generated samples. This not
only makes the classifier more robust but also boosts the overall ranking
performance. Our model achieves a relative gain compared to baselines by over
26% in F-score, and over 17% in Area Under PR curve. On live search traffic,
our model gains significant improvement in multiple countries.
- Abstract(参考訳): 検索クエリインテントにマッチしない項目の表示は、eコマースにおける顧客エクスペリエンスを低下させる。
これらのミスマッチは、検索ログのクリックや購入などのノイズの多い行動信号に対するランキングアルゴリズムの反実バイアスに起因する。
問題を緩和するには大きなラベル付きデータセットが必要である。
本稿では,ミスマッチを効果的に分類し,不整合な例を生成して分類器を改善するための,エンド・ツー・エンドの深層モデルを開発した。
実際のサンプルと生成されたサンプルを交互に使用するクロスエントロピー損失に潜在変数を導入することで、モデルエンドツーエンドをトレーニングする。
これにより分類器がより堅牢になるだけでなく、全体的なランキングパフォーマンスも向上する。
本モデルは,f-scoreでは26%,pr曲線下の領域では17%以上,ベースラインと比較して相対的に向上する。
ライブ検索トラフィックでは、複数の国でモデルが大きく改善されている。
関連論文リスト
- Noisy Correspondence Learning with Self-Reinforcing Errors Mitigation [63.180725016463974]
クロスモーダル検索は、実際は精力的な、十分に整合した大規模データセットに依存している。
我々は、新しい雑音対応学習フレームワーク、textbfSelf-textbfReinforcing textbfErrors textbfMitigation(SREM)を導入する。
論文 参考訳(メタデータ) (2023-12-27T09:03:43Z) - Multi-output Headed Ensembles for Product Item Classification [0.9053163124987533]
本稿では,eコマースカタログを対象としたディープラーニングに基づく分類モデルフレームワークを提案する。
我々は、ロバストな業界標準ベースラインモデルに対する改善を示す。
また,ユーザセッションを用いたモデル性能評価手法を提案する。
論文 参考訳(メタデータ) (2023-07-29T01:23:36Z) - Unified Embedding Based Personalized Retrieval in Etsy Search [0.206242362470764]
グラフ, 変換器, 項ベース埋め込みを終末に組み込んだ統合埋め込みモデルを学習することを提案する。
我々のパーソナライズされた検索モデルは、検索購入率5.58%、サイト全体のコンバージョン率2.63%によって、検索体験を著しく改善する。
論文 参考訳(メタデータ) (2023-06-07T23:24:50Z) - Consistent Text Categorization using Data Augmentation in e-Commerce [1.558017967663767]
一貫性のあるテキスト分類のための新しいフレームワークを提案する。
私たちの目標は、本番レベルのパフォーマンスを維持しながら、モデルの一貫性を改善することです。
論文 参考訳(メタデータ) (2023-05-09T12:47:28Z) - Smoothly Giving up: Robustness for Simple Models [30.56684535186692]
このようなモデルをトレーニングするアルゴリズムの例としては、ロジスティック回帰とブースティングがある。
我々は、標準凸損失関数間のチューニングを行う、$Served-Servedジョイント凸損失関数を用いて、そのようなモデルを堅牢に訓練する。
また、ロジスティック回帰のためのCOVID-19データセットを強化し、複数の関連ドメインにまたがる効果のアプローチを強調します。
論文 参考訳(メタデータ) (2023-02-17T19:48:11Z) - Part-Based Models Improve Adversarial Robustness [57.699029966800644]
人間の事前知識とエンドツーエンドの学習を組み合わせることで、ディープニューラルネットワークの堅牢性を向上させることができることを示す。
我々のモデルは、部分分割モデルと小さな分類器を組み合わせて、オブジェクトを同時に部品に分割するようにエンドツーエンドに訓練されている。
実験の結果,これらのモデルによりテクスチャバイアスが低減され,一般的な汚職に対する堅牢性が向上し,相関が急上昇することが示唆された。
論文 参考訳(メタデータ) (2022-09-15T15:41:47Z) - On the Efficacy of Adversarial Data Collection for Question Answering:
Results from a Large-Scale Randomized Study [65.17429512679695]
逆データ収集(ADC)では、人間の労働力がモデルとリアルタイムで対話し、誤った予測を誘発する例を作成しようとする。
ADCの直感的な魅力にも拘わらず、敵対的データセットのトレーニングがより堅牢なモデルを生成するかどうかは不明だ。
論文 参考訳(メタデータ) (2021-06-02T00:48:33Z) - Heterogeneous Network Embedding for Deep Semantic Relevance Match in
E-commerce Search [29.881612817309716]
Eコマースアイテム関連性のためのエンドツーエンドの第一次および第二次関連性予測モデルを設計します。
BERTから生成された外部知識を導入し,ユーザ行動のネットワークを改良する。
オフライン実験の結果,新しいモデルにより,人間関係判定における予測精度が有意に向上した。
論文 参考訳(メタデータ) (2021-01-13T03:12:53Z) - Adversarial Examples for $k$-Nearest Neighbor Classifiers Based on
Higher-Order Voronoi Diagrams [69.4411417775822]
逆例は機械学習モデルにおいて広く研究されている現象である。
そこで本研究では,$k$-nearest 近傍分類の逆ロバスト性を評価するアルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-11-19T08:49:10Z) - The Devil is in Classification: A Simple Framework for Long-tail Object
Detection and Instance Segmentation [93.17367076148348]
本稿では,最新のロングテールLVISデータセットを用いて,最先端の2段階のインスタンスセグメンテーションモデルMask R-CNNの性能低下について検討する。
主な原因は、オブジェクト提案の不正確な分類である。
そこで本研究では,2段階のクラスバランスサンプリング手法により,分類ヘッドバイアスをより効果的に緩和する,簡単な校正フレームワークを提案する。
論文 参考訳(メタデータ) (2020-07-23T12:49:07Z) - AvgOut: A Simple Output-Probability Measure to Eliminate Dull Responses [97.50616524350123]
機能エンジニアリングなしで、どの発話やトークンが退屈であるかを動的に認識する対話モデルを構築します。
最初のモデルMinAvgOutは、各バッチの出力分布を通して、ダイバーシティスコアを直接最大化する。
第2のモデルであるラベルファインチューニング(LFT)は、多様性スコアによって連続的にスケールされたラベルをソースシーケンスにプリペイドし、多様性レベルを制御する。
3つ目のモデルであるRLは強化学習を採用し、多様性スコアを報奨信号として扱う。
論文 参考訳(メタデータ) (2020-01-15T18:32:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。