論文の概要: Towards Generalizeable Semantic Product Search by Text Similarity
Pre-training on Search Click Logs
- arxiv url: http://arxiv.org/abs/2204.05231v1
- Date: Mon, 11 Apr 2022 16:23:35 GMT
- ステータス: 処理完了
- システム内更新日: 2022-04-12 13:47:01.685028
- Title: Towards Generalizeable Semantic Product Search by Text Similarity
Pre-training on Search Click Logs
- Title(参考訳): 検索クリックログに基づくテキスト類似性事前学習による汎用的セマンティック製品検索に向けて
- Authors: Zheng Liu, Wei Zhang, Yan Chen, Weiyi Sun, Michael Du, Benjamin
Schroeder
- Abstract要約: 一般ドメインの微調整は、先行技術の発見と一致する一般化に役立ちません。
クリックストリームデータによる適切なドメイン固有の微調整は、公開されている手動の注釈付きクエリ-製品ペアデータのバケット分析に基づいて、モデル一般化の改善につながる可能性がある。
- 参考スコア(独自算出の注目度): 9.00729275535796
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Recently, semantic search has been successfully applied to e-commerce product
search and the learned semantic space(s) for query and product encoding are
expected to generalize to unseen queries or products. Yet, whether
generalization can conveniently emerge has not been thoroughly studied in the
domain thus far. In this paper, we examine several general-domain and
domain-specific pre-trained Roberta variants and discover that general-domain
fine-tuning does not help generalization, which aligns with the discovery of
prior art. Proper domain-specific fine-tuning with clickstream data can lead to
better model generalization, based on a bucketed analysis of a publicly
available manual annotated query-product pair data.
- Abstract(参考訳): 近年,eコマース製品検索にセマンティック検索が適用され,クエリや製品エンコーディングのための学習意味空間が,未認識のクエリや製品に一般化することが期待されている。
しかし、この領域では、便利に一般化できるかどうかが十分に研究されていない。
本稿では、いくつかの一般ドメインおよびドメイン固有の事前学習されたロバータ変種を調査し、一般ドメインの微調整が一般化に役立たないことを発見し、先行技術の発見と整合する。
クリックストリームデータによる適切なドメイン固有の微調整は、公開されている手動注釈付きクエリ-製品ペアデータのバケット分析に基づいて、モデル一般化の改善につながる可能性がある。
関連論文リスト
- UQE: A Query Engine for Unstructured Databases [71.49289088592842]
構造化されていないデータ分析を可能にするために,大規模言語モデルの可能性を検討する。
本稿では,非構造化データ収集からの洞察を直接問合せ,抽出するUniversal Query Engine (UQE)を提案する。
論文 参考訳(メタデータ) (2024-06-23T06:58:55Z) - DIGIC: Domain Generalizable Imitation Learning by Causal Discovery [69.13526582209165]
因果性は機械学習と組み合わせて、ドメインの一般化のための堅牢な表現を生成する。
我々は、実証データ分布を活用して、ドメインの一般化可能なポリシーの因果的特徴を発見するために、異なる試みを行っている。
DIGICと呼ばれる新しいフレームワークを設計し、実演データ分布から専門家行動の直接的な原因を見出すことにより因果的特徴を識別する。
論文 参考訳(メタデータ) (2024-02-29T07:09:01Z) - Text-Based Product Matching -- Semi-Supervised Clustering Approach [9.748519919202986]
本稿では,半教師付きクラスタリング手法を用いた製品マッチングの新しい哲学を提案する。
実世界のデータセット上でIDECアルゴリズムを実験することにより,本手法の特性について検討する。
論文 参考訳(メタデータ) (2024-02-01T18:52:26Z) - Label-Efficient Domain Generalization via Collaborative Exploration and
Generalization [28.573872986524794]
本稿では,ラベル制限されたソースドメインを用いたモデル一般化を実現するために,ラベル効率のよいドメイン一般化(LEDG)を提案する。
本稿では,活発な探索と半教師付き一般化を共同で最適化する,共同探索・一般化(CEG)と呼ばれる新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2022-08-07T05:34:50Z) - Single-domain Generalization in Medical Image Segmentation via Test-time
Adaptation from Shape Dictionary [64.5632303184502]
ドメインの一般化は通常、モデル学習のために複数のソースドメインからのデータを必要とする。
本稿では,1つのソースドメインのみで最悪のシナリオ下でモデルを学習し,異なる未確認対象ドメインに直接一般化する,重要な単一ドメインの一般化問題について考察する。
本稿では,領域間で不変なセグメンテーションのセグメンテーション先情報を抽出し,統合する医用画像セグメンテーションにおいて,この問題に対処する新しいアプローチを提案する。
論文 参考訳(メタデータ) (2022-06-29T08:46:27Z) - Compound Domain Generalization via Meta-Knowledge Encoding [55.22920476224671]
マルチモーダル分布を再正規化するために,スタイル駆動型ドメイン固有正規化(SDNorm)を導入する。
組込み空間における関係モデリングを行うために,プロトタイプ表現,クラスセントロイドを利用する。
4つの標準ドメイン一般化ベンチマークの実験により、COMENはドメインの監督なしに最先端のパフォーマンスを上回ることが判明した。
論文 参考訳(メタデータ) (2022-03-24T11:54:59Z) - Improving Multi-Domain Generalization through Domain Re-labeling [31.636953426159224]
本稿では,事前特定ドメインラベルと一般化性能の関連性について検討する。
マルチドメイン一般化のための一般的なアプローチであるMulDEnsを導入し,ERMをベースとした深層アンサンブルバックボーンを用いた。
我々は、MulDEnsがデータセット固有の拡張戦略やトレーニングプロセスの調整を必要としないことを示す。
論文 参考訳(メタデータ) (2021-12-17T23:21:50Z) - Text Summarization with Latent Queries [60.468323530248945]
本稿では,LaQSumについて紹介する。LaQSumは,既存の問合せ形式と抽象的な要約のための文書から遅延クエリを学習する,最初の統一テキスト要約システムである。
本システムでは, 潜伏クエリモデルと条件付き言語モデルとを協調的に最適化し, ユーザがテスト時に任意のタイプのクエリをプラグイン・アンド・プレイできるようにする。
本システムでは,クエリタイプ,文書設定,ターゲットドメインの異なる要約ベンチマークにおいて,強力な比較システムの性能を強く向上させる。
論文 参考訳(メタデータ) (2021-05-31T21:14:58Z) - APRF-Net: Attentive Pseudo-Relevance Feedback Network for Query
Categorization [12.634704014206294]
クエリ分類のためのレアクエリの表現を強化するために,textbfAttentive textbfPseudo textbfRelevance textbfFeedback textbfNetwork (APRF-Net) という新しいディープニューラルネットワークを提案する。
以上の結果から,APRF-Netはクエリ分類をF1@1$スコアで5.9%改善し,レアクエリでは8.2%向上した。
論文 参考訳(メタデータ) (2021-04-23T02:34:08Z) - Generalizing to Unseen Domains: A Survey on Domain Generalization [59.16754307820612]
ドメイン一般化は、1つまたは複数の異なるが関連するドメインが与えられる困難な設定を扱う。
目標は、目に見えないテストドメインに一般化できるモデルを学ぶことです。
本稿では,領域一般化の最近の進歩に対する最初のレビューを紹介する。
論文 参考訳(メタデータ) (2021-03-02T06:04:11Z) - In Search of Lost Domain Generalization [25.43757332883202]
ドメインの一般化のためのテストベッドであるDomainBedを実装します。
DomainBedを用いて広範な実験を行い、慎重に実装すると、経験的リスク最小化が最先端のパフォーマンスを示すことを確かめる。
論文 参考訳(メタデータ) (2020-07-02T23:08:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。