論文の概要: TPDR: A Novel Two-Step Transformer-based Product and Class Description
Match and Retrieval Method
- arxiv url: http://arxiv.org/abs/2310.03491v1
- Date: Thu, 5 Oct 2023 12:02:51 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-06 16:25:04.309732
- Title: TPDR: A Novel Two-Step Transformer-based Product and Class Description
Match and Retrieval Method
- Title(参考訳): tpdr:新しい2段階変圧器に基づく製品とクラス記述マッチングおよび検索方法
- Authors: Washington Cunha, Celso Fran\c{c}a, Leonardo Rocha, Marcos Andr\'e
Gon\c{c}alves
- Abstract要約: 本稿では,2段階のトランスフォーマーベース製品とクラス記述検索手法を提案する。
TPDRは注意機構とコントラスト学習を利用して、ISとSD間の意味的対応を探索する。
71%の症例において, 正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正
- 参考スコア(独自算出の注目度): 5.388982643630806
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: There is a niche of companies responsible for intermediating the purchase of
large batches of varied products for other companies, for which the main
challenge is to perform product description standardization, i.e., matching an
item described by a client with a product described in a catalog. The problem
is complex since the client's product description may be: (1) potentially
noisy; (2) short and uninformative (e.g., missing information about model and
size); and (3) cross-language. In this paper, we formalize this problem as a
ranking task: given an initial client product specification (query), return the
most appropriate standardized descriptions (response). In this paper, we
propose TPDR, a two-step Transformer-based Product and Class Description
Retrieval method that is able to explore the semantic correspondence between IS
and SD, by exploiting attention mechanisms and contrastive learning. First,
TPDR employs the transformers as two encoders sharing the embedding vector
space: one for encoding the IS and another for the SD, in which corresponding
pairs (IS, SD) must be close in the vector space. Closeness is further enforced
by a contrastive learning mechanism leveraging a specialized loss function.
TPDR also exploits a (second) re-ranking step based on syntactic features that
are very important for the exact matching (model, dimension) of certain
products that may have been neglected by the transformers. To evaluate our
proposal, we consider 11 datasets from a real company, covering different
application contexts. Our solution was able to retrieve the correct
standardized product before the 5th ranking position in 71% of the cases and
its correct category in the first position in 80% of the situations. Moreover,
the effectiveness gains over purely syntactic or semantic baselines reach up to
3.7 times, solving cases that none of the approaches in isolation can do by
themselves.
- Abstract(参考訳): 他社向けの多種多様な製品の大量購入を仲介するニッチな企業が多く、その主な課題は、顧客によって記述された商品とカタログに記載された商品とをマッチングする製品記述標準化を行うことである。
クライアントの製品記述は、(1)潜在的に騒がしい、(2)短くて不規則な(例えば、モデルやサイズに関する情報の欠如)、(3)言語横断、などである。
本稿では,この問題をランク付けタスクとして定式化する。初期クライアント製品仕様(クエリ)を与えられた場合,最も適切な標準記述(応答)を返す。
本稿では,IS と SD のセマンティック対応を,注意機構とコントラスト学習を利用して探索できる2段階の変換器ベース製品とクラス記述検索手法である TPDR を提案する。
まず、TPDRは、埋め込みベクトル空間を共有する2つのエンコーダとして変換器を使用し、1つはISを符号化し、もう1つはSDを符号化し、対応するペア(IS, SD)はベクトル空間に近接しなければならない。
さらに、特殊損失関数を利用したコントラスト学習機構により、クローズネスをさらに強化する。
TPDRはまた、変換器によって無視されたかもしれない特定の製品の正確なマッチング(モデル、次元)において非常に重要な構文的特徴に基づく(第2の)再ランクのステップを利用する。
提案を評価するために,実企業からの11のデータセットを検討し,異なるアプリケーションコンテキストをカバーする。
提案手法では,71%のケースにおいて第5位の前に正しい商品を,80%の状況で第1位で正しいカテゴリを検索することができた。
さらに、純粋に構文的あるいは意味的ベースラインよりも有効性が3.7倍に向上し、分離されたアプローチが単独ではできないようなケースが解決される。
関連論文リスト
- Learning variant product relationship and variation attributes from e-commerce website structures [5.273938705774915]
我々は,電子商取引カタログにおける変種商品のペアを特定するために,変種関係マッチング戦略であるVARMを導入する。
我々はRAG誘導生成LDMを用いて変異産物群間の変異と共通属性を抽出する。
論文 参考訳(メタデータ) (2024-09-17T18:24:27Z) - CROSS-JEM: Accurate and Efficient Cross-encoders for Short-text Ranking Tasks [12.045202648316678]
トランスフォーマーベースのランキングモデルは、そのようなタスクに対する最先端のアプローチである。
CROSS-JEM(Joint Efficient Modeling)を用いたクロスエンコーダを提案する。
CROSS-JEMは、トランスフォーマーベースのモデルでクエリの複数の項目を共同でスコアすることを可能にする。
最先端の精度を実現し、標準のクロスエンコーダよりも4倍低いランクのレイテンシを実現している。
論文 参考訳(メタデータ) (2024-09-15T17:05:35Z) - JPAVE: A Generation and Classification-based Model for Joint Product
Attribute Prediction and Value Extraction [59.94977231327573]
JPAVEと呼ばれる値生成/分類と属性予測を備えたマルチタスク学習モデルを提案する。
我々のモデルの2つの変種は、オープンワールドとクローズドワールドのシナリオのために設計されている。
公開データセットにおける実験結果は,強いベースラインと比較して,我々のモデルが優れていることを示す。
論文 参考訳(メタデータ) (2023-11-07T18:36:16Z) - Multi-Modal Representation Learning with Self-Adaptive Thresholds for
Commodity Verification [0.0]
電子商取引のシナリオでは、商品は通常、画像とテキストの両方で記述される。
定義上、同一の商品は同一のキー属性を持ち、認知的に消費者と同一である。
本稿では,自己適応しきい値に基づくエンドツーエンドの同一商品検証手法を提案する。
論文 参考訳(メタデータ) (2022-08-23T16:14:59Z) - Learning to Diversify for Product Question Generation [68.69526529887607]
本稿では,T5の事前学習型トランスフォーマー・デコーダモデルについて述べる。
本稿では,トランスフォーマーモデルによって学習された言語を豊かにするための,新たな学習・多様化(LTD)手法を提案する。
論文 参考訳(メタデータ) (2022-07-06T09:26:41Z) - Entity-Graph Enhanced Cross-Modal Pretraining for Instance-level Product
Retrieval [152.3504607706575]
本研究の目的は, 細粒度製品カテゴリを対象とした, 弱制御型マルチモーダル・インスタンスレベルの製品検索である。
まず、Product1Mデータセットをコントリビュートし、2つの実際のインスタンスレベルの検索タスクを定義します。
我々は、マルチモーダルデータから重要な概念情報を組み込むことができるより効果的なクロスモーダルモデルを訓練するために活用する。
論文 参考訳(メタデータ) (2022-06-17T15:40:45Z) - Label Distributionally Robust Losses for Multi-class Classification:
Consistency, Robustness and Adaptivity [55.29408396918968]
多クラス分類のためのラベル分布ロバスト(LDR)損失という損失関数群について検討した。
我々の貢献は、多クラス分類のためのLDR損失のトップ$kの一貫性を確立することによって、一貫性と堅牢性の両方を含んでいる。
本稿では,各インスタンスのクラスラベルの雑音度に個別化温度パラメータを自動的に適応させる適応型LDR損失を提案する。
論文 参考訳(メタデータ) (2021-12-30T00:27:30Z) - Product1M: Towards Weakly Supervised Instance-Level Product Retrieval
via Cross-modal Pretraining [108.86502855439774]
弱教師付きマルチモーダル・インスタンスレベルの製品検索を目的とした,より現実的な設定について検討する。
実世界のインスタンスレベルの検索において,最も大規模なマルチモーダル化粧品データセットであるProduct1Mをコントリビュートする。
ケースレベルの予測検索(CAPTURE)のためのクロスモーダル・コントラサシブ・プロダクト・トランスフォーマーという新しいモデルを提案する。
論文 参考訳(メタデータ) (2021-07-30T12:11:24Z) - Automatic Validation of Textual Attribute Values in E-commerce Catalog
by Learning with Limited Labeled Data [61.789797281676606]
そこで我々はMetaBridgeと呼ばれる新しいメタ学習潜伏変数アプローチを提案する。
限られたラベル付きデータを持つカテゴリのサブセットから、転送可能な知識を学ぶことができる。
ラベルのないデータで、目に見えないカテゴリの不確実性を捉えることができる。
論文 参考訳(メタデータ) (2020-06-15T21:31:05Z) - Online Similarity Learning with Feedback for Invoice Line Item Matching [3.0803859277148535]
大企業におけるP2P(Properure to Pay Process)は、企業運営のための製品やサービスの調達を扱う。
P2Pプロセスを編成するエージェントは、請求書内の製品やサービス記述と購入順に一致する問題に遭遇することが多い。
本稿では, 各種エージェントのフィードバックデータを用いて, この問題を解決するための2つの方法を提案する。
論文 参考訳(メタデータ) (2020-01-02T01:28:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。